博弈论-蒋文华-浙江大学.docx
《博弈论-蒋文华-浙江大学.docx》由会员分享,可在线阅读,更多相关《博弈论-蒋文华-浙江大学.docx(73页珍藏版)》请在课桌文档上搜索。
1、第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。第一章何为“博弈”博:博览全局弈:对弈棋局一谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,乂跟所遇到的外部环境的变化有关。特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提不:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅
2、取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。特别提不:站在别人的立场上想一想,就是为自己未来的遭遇着想。一一米兰昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。-汉代刘向,围棋赋二、西方的理解game(规贝
3、IJ)费厄泼赖(fairplay)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。三、斯塔克尔伯格模型该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。第二节理论的诞生
4、与发展1、20世纪40年代的社会变化。2、约翰冯诺依曼(JohnVonNeumann,19031957)的卓越贡献。1944年冯诺依曼和摩根斯坦发表博弈论和经济行为3、约翰福布斯纳什(JohnForbesNash)的发扬光大1994年纳什、海萨尼和泽尔腾获诺贝尔经济学奖一一约翰海萨尼(2000年去世,终年80岁)4、后来的发展方向其一个对纳什均衡的弱化(或一般化),其二是对纳什均衡的精炼(或筛选)。其三是对博弈论的基本假设的研究。其四是对博弈论的应用研究。2005年奥曼和谢林诺贝尔经济学奖一一奥曼从数学的角度,谢林从经济学的角度用博弈论重塑了对人类社会相互行为影响的分析框架特别提示:学习博弈论
5、,让我们学会更好地和他人合作,善莫大焉!第三章术语解读第一节博弈的术语1、参与人(Players):理性选择的主体。2、信息(information):参与者有关博弈的知识。“知己知彼,百战不殆。”3、行动(action):参与者能够选择的变量。4、策略(Strategies):参与者在行动之前所准备好的一套完整的行动方案(预案)。(1)完整性(2)多样性(3)不可观察性人不犯我,我不犯人;人若犯我,我必犯人5、损益(Payoff):参与者的得与失。6、结局(outcome):所有参与者选择各自策略后的结果。7、均衡(equilibrium):所有参与者的最优策略组合。8、博弈的规则(rule
6、softhegame):参与者、行动和结果合起来称为博弈的规则。博弈论(gametheory):是一种研究人们怎么做策略(行动)选择及其最后的均衡结果会是什么的理论。好的应急预案:1、what?(信息分类)2、who?(责任到人)3、action?(措施具体)4、when?(时效性)特别提示:策略让我们建立起了从信息到行动的快速反应机制,从而能够以最快的速度做出行动选择。第二节博弈的分类合作博弈和非合作博弈合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。非合作博弈:指参与者无法达成这样一种协议。静态博弈和动态博弈静态博弈:指在博弈中,参与者同时选择,或虽非同时
7、选择,但是在逻辑时间上是同时的。动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。完全信息博弈和不完全信息博弈完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。不完全信息博弈:总有一些信息不是所有参与者都知道的。零和博弈与非零和博弈和)零和博弈:指博弈前的损益总和与博弈后的损益总和相等。非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负特别提示:不玩负和游戏,少玩零和游戏,多玩正和游戏。第二讲基本假设第四章基本假设第一节理性假设一、认知理性人是自我利益的判断者偏好的完备性(completeness)(只有A
8、B,AB,BC,则AC)中庸之道(综合激励)(若AB,C=(A+B)2,贝JOA或B)二、行为的理性自我利益的追求者(行为者)利益最大化(两利相权取其重,两害相权取其轻)参照特别提示:顾客需要的不是便宜,而是占到了便宜。参照系(牢牢掌握在自己的手里)特别提不:如果不给对方您的两利让其相权,那么对方就很可能会把您的一利和他人的一利相权,从而离您而去。(当我们让别人做选择时,要多做选择题,少做判断题)特别提示:1、让对方在2个或3个里面做选择。2、给对方的几个选项必须有明显区别。特别提示:人虽然不是完全理性的(有限理性),但是一定不能被认为是完全非理性的。特别提不:愿意吃亏,与那些比你更愿意吃亏的
9、人做朋友。特别提不:笑容让人类更容易建立合作关系。学会微笑,会让你受益匪浅!第二节共同知识假设共同知识(commonknowledge):指各参与者在无穷递归意义上均知悉的事实。即每个人知道事件E,每个人知道每个人知道事件E,每个人知道每个人知道每个人知道事件E一直到无穷层次。特别提示:达成共识是一件非常困难的事情。特别提不:在信息不对称的情况下,有时候博弈的结果不取决于大家是怎么想的,而取决于大家认为大家是怎么想的。特别提不:民主谁也挡不住,要么开门让他进来;要么看着它破门而入。这只是时间问题。第三讲囚犯困境和破解之道第五章囚犯困境及原因第一节囚犯困境的来源占优策略:是指无论其他参与者采取什
10、么策略,某参与者采用该策略的结果都优于其他策略。占优策略均衡:是指由博弈中的所有参与者的占优策略组合所构成的均衡。特别提示:游戏规则决定游戏的结局均衡的结果跟所谓的事实的真相是没有任何关系的第二节囚犯困境的定义及原因分析一般条件下的囚犯困境1、双方都有占优策略,即:ala3,a2a4,blb2,b3b4在ala3,a2a4的条件下,张三选择背叛是占优策略;在blb2,b3b4的条件下,李四选择背叛是占优策略2、存在一个合作解,使双方的收益都优于其在占优策略均衡下的收益,即:ala4,blSRT,那么其占优策略均衡(R,R)就构成了囚犯困境。(个人理性与集体非理性)特别提示:表面上看囚犯对自身利
11、益的追求是导致囚犯困境的原因,其实,真正的原因是:囚犯们在追求自身利益的同时,以更多地损害他人利益为代价。(君子爱财,取之以道)特别提不:囚犯困境的根本原因在于:私人成本与社会成本的差异,即个人行为的负外部性。特别提示:损人利己和损己利人本质上是一样的,是一个硬币的正反两面;从一方来看是损己利人的行为,在另一方来看是损人利己的行为,问题的关键是所损(失)的部分和所利(得)的部分哪个更多。(盗窃与抢劫)特别提示:如果有一种制度,在该制度下,每个人都只能通过利人才能实现利己的目标,这一定是一种好的制度。(市场的逻辑)第六章真实世界的囚犯困境第一节大萧条与凯恩斯革命一、大萧条二、凯恩斯对大萧条的解释
12、1、消费需求不足2、投资需求不足3、价格刚性第二节价格战第三节独裁与多数人的懦弱第四节民主与多数人的暴政一、我所记忆的建国后开展的历次运动:土地改革运动(2)镇压反革命运动抗美援朝运动建国后第一次整风运动连队民主运动三查运动忠诚老实政治自觉运动清理“中层”运动(9)民主改革运动(10)电影武训传和宣传武训的批判运动(11)三自革新学习与教会民主改革运动(12)农业生产互助合作运动(13)文化教育战线和各种知识分子自我教育和自我改造运动(14)反贪污、反浪费、反官僚主义的三反运动(15)文学艺术界整风学习运动(16)爱国增产节约运动(0)教育、文艺、科学等方面在三反运动中仍进行思想改造学习运动(
13、18)中央希望华东、中南、西北三大区在大规模的学校教师思想改造会议上,推动学校教师及教育行政人员的思想改造工作(19)反对行贿、反对偷税漏税、反对盗窃国家财产、反对偷工减料和反对盗窃国家经济情报的五反运动(20)反对违法乱纪运动(又称新三反)(21)整党建党运动(22)学习运动(23)从批判胡风文艺思想到肃清胡风反革命集团运动(24)肃清暗藏的反革命分子运动(25)胡适思想批判运动(26)整风运动(27)反右派运动(28)工商界整风运动(29)以除四害为中心的爱国卫生运动(30)大跃进运动(31)人民公社化运动(32)农村工具改良运动(33)农村社会主义和共产主义教育运动(34)反对右倾思想运
14、动(35)增产节约运动(36)养猪运动(37)整风运动(38)整风整社运动(又名农村三反运动)(39)技术革新和技术革命运动(40)爱国卫生运动(41)工业企业学解放军运动(42)学习雷锋运动(43)干部参加劳动运动(44)农村社会主义教育运动(又名四清运动,在城市叫五反运动)(45)群众性设计革命运动(46)增产节约运动(47)文化大革命运动(48)清查五一六”运动(49)批陈整风运动(50)批林批孔运动(51)开展对水浒评论的运动(52)“批邓、反击右倾翻案风”运动一摘录于胡甫臣对建国后历次政治运动的认识特别提示:民主必须与法治(不是法制)相辅相成,才能避免多数人的暴政。法治:RJieOf
15、law,是最高准则,最高理念,社会意识法制:rulebylaw,通过法律治理国家,是统治的工具第七章如何破解囚徒困境第一节如何利用他人的囚犯困境货比三家分而治之第二节如何破解囚犯困境一、道德教化(文化建设)社会学基本定理金迪斯(H.Gintis):如果一个社会都是由自利主义者构成的,那么,长期而言,这个社会将消亡。而如果一个社会,通过“说服教育”以及其他说教机构的努力,长期保持一定比例的利他主义者,它就能够稳定地繁衍下去。二、财产私有(制度建设)圈地运动(个人成本与社会成本相一致)人民公社(偷懒是一种占优策略)三、温故知新1、让历史告诉未来(重复博弈)2、学习博弈论基础课程第四讲万元陷阱和智猪
16、博弈第八章万元陷阱自古以来,人类为捕杀动物所设的陷阱,有三个特征:有一个明显的诱饵。通往诱饵之路是单向的,可进不可出。越想挣脱,就越陷越深。沉没成本效应与路径依赖投资已经过半之后,如果要改变投资方向或暂停投资,都是一个颇为困难的事儿。沉没成本和转移成本的比较沉没成本是指由于过去的决策已经发生了的,而不能由现在或将来的任何决策改变的成本。我们把这些己经发生不可收回的支出,如时间、金钱、精力等称为“沉没成本”(SunkCost)o在经济学和商业决策制定过程中会用到“沉没成本”的概念。沉没成本会导致路径依赖。转移成本是消费者在购买一件商品以取代原有商品的过程中,过渡所需要支付的费用。Paulklem
17、perer基于经验产品的角度解释转移成本的构成:第一、学习的成本。如从QWERTY键盘转移到DVOrak键盘将花费的培训和学习费用,这已经成为市场失灵的经典案例。第二、交易的成本。如更换供应商所面临的风险以及交易费用。第三、机会成本(ArtificialSwitchingCost)o如“老客户优惠”的损失等。这里的转移成本应该是消费者承担的成本和新供应商承担的成本总和。转移成本衡量了顾客对某一位供应商的锁定程度。转移成本是对路径依赖程度和锁定程度的衡量。社会心理学家泰格(ATeger)对参加拍卖游戏的人加以分析,发现掉入陷阱的人通常有两个动机,一是经济(理性)的、一是非经济(感性)的。经济动机
18、包括渴望赢得钞票、想赢回他的损失、想避免更多的损失;非经济动机包括渴望挽回面子、证明自己是最好的玩家及处罚对手等。心理学家鲁宾(确立你投入的极限及预先的约定:譬如投资多少钱或多少时间?极限一经确立,就要坚持到底。(止损)f止盈容易止损难!原因:贴现;人对亏损比盈利要敏感得多(亏损带来的难受程度不等价于同样收益带来的满足程度)。人在正常情况下是厌恶风险的,但是一旦亏损,会立马从一个厌恶风险的人转变成一个偏好风险的人。学会止损会让你活得更久!3.自己打定主意,不必看别人。特别提示:既然事情已经发生,请坦然接受!特别提示:每个人都有犯错的时候,请把注意力放在以后如何避免犯同样的错!蒋文华的补充建议是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 文华 浙江大学
链接地址:https://www.desk33.com/p-154610.html