博弈论-蒋文华-浙江大学.docx
第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。第一章何为“博弈”博:博览全局弈:对弈棋局一谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,乂跟所遇到的外部环境的变化有关。特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提不:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。特别提不:站在别人的立场上想一想,就是为自己未来的遭遇着想。一一米兰昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。-汉代刘向,围棋赋二、西方的理解game(规贝IJ)费厄泼赖(fairplay)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。三、斯塔克尔伯格模型该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。第二节理论的诞生与发展1、20世纪40年代的社会变化。2、约翰冯诺依曼(JohnVonNeumann,19031957)的卓越贡献。1944年冯诺依曼和摩根斯坦发表博弈论和经济行为3、约翰福布斯纳什(JohnForbesNash)的发扬光大1994年纳什、海萨尼和泽尔腾获诺贝尔经济学奖一一约翰海萨尼(2000年去世,终年80岁)4、后来的发展方向其一个对纳什均衡的弱化(或一般化),其二是对纳什均衡的精炼(或筛选)。其三是对博弈论的基本假设的研究。其四是对博弈论的应用研究。2005年奥曼和谢林诺贝尔经济学奖一一奥曼从数学的角度,谢林从经济学的角度用博弈论重塑了对人类社会相互行为影响的分析框架特别提示:学习博弈论,让我们学会更好地和他人合作,善莫大焉!第三章术语解读第一节博弈的术语1、参与人(Players):理性选择的主体。2、信息(information):参与者有关博弈的知识。“知己知彼,百战不殆。”3、行动(action):参与者能够选择的变量。4、策略(Strategies):参与者在行动之前所准备好的一套完整的行动方案(预案)。(1)完整性(2)多样性(3)不可观察性人不犯我,我不犯人;人若犯我,我必犯人5、损益(Payoff):参与者的得与失。6、结局(outcome):所有参与者选择各自策略后的结果。7、均衡(equilibrium):所有参与者的最优策略组合。8、博弈的规则(rulesofthegame):参与者、行动和结果合起来称为博弈的规则。博弈论(gametheory):是一种研究人们怎么做策略(行动)选择及其最后的均衡结果会是什么的理论。好的应急预案:1、what?(信息分类)2、who?(责任到人)3、action?(措施具体)4、when?(时效性)特别提示:策略让我们建立起了从信息到行动的快速反应机制,从而能够以最快的速度做出行动选择。第二节博弈的分类合作博弈和非合作博弈合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。非合作博弈:指参与者无法达成这样一种协议。静态博弈和动态博弈静态博弈:指在博弈中,参与者同时选择,或虽非同时选择,但是在逻辑时间上是同时的。动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。完全信息博弈和不完全信息博弈完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。不完全信息博弈:总有一些信息不是所有参与者都知道的。零和博弈与非零和博弈和)零和博弈:指博弈前的损益总和与博弈后的损益总和相等。非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负特别提示:不玩负和游戏,少玩零和游戏,多玩正和游戏。第二讲基本假设第四章基本假设第一节理性假设一、认知理性人是自我利益的判断者偏好的完备性(completeness)(只有A>B,A<B,AB三种情况)偏好的传递性(transitivity)(A>B,B>C,则A>C)中庸之道(综合激励)(若AB,C=(A+B)2,贝JOA或B)二、行为的理性自我利益的追求者(行为者)利益最大化(两利相权取其重,两害相权取其轻)参照特别提示:顾客需要的不是便宜,而是占到了便宜。参照系(牢牢掌握在自己的手里)特别提不:如果不给对方您的两利让其相权,那么对方就很可能会把您的一利和他人的一利相权,从而离您而去。(当我们让别人做选择时,要多做选择题,少做判断题)特别提示:1、让对方在2个或3个里面做选择。2、给对方的几个选项必须有明显区别。特别提示:人虽然不是完全理性的(有限理性),但是一定不能被认为是完全非理性的。特别提不:愿意吃亏,与那些比你更愿意吃亏的人做朋友。特别提不:笑容让人类更容易建立合作关系。学会微笑,会让你受益匪浅!第二节共同知识假设共同知识(commonknowledge):指各参与者在无穷递归意义上均知悉的事实。即每个人知道事件E,每个人知道每个人知道事件E,每个人知道每个人知道每个人知道事件E一直到无穷层次。特别提示:达成共识是一件非常困难的事情。特别提不:在信息不对称的情况下,有时候博弈的结果不取决于大家是怎么想的,而取决于大家认为大家是怎么想的。特别提不:民主谁也挡不住,要么开门让他进来;要么看着它破门而入。这只是时间问题。第三讲囚犯困境和破解之道第五章囚犯困境及原因第一节囚犯困境的来源占优策略:是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于其他策略。占优策略均衡:是指由博弈中的所有参与者的占优策略组合所构成的均衡。特别提示:游戏规则决定游戏的结局均衡的结果跟所谓的事实的真相是没有任何关系的第二节囚犯困境的定义及原因分析一般条件下的囚犯困境1、双方都有占优策略,即:al>a3,a2>a4,bl>b2,b3>b4在al>a3,a2>a4的条件下,张三选择背叛是占优策略;在bl>b2,b3>b4的条件下,李四选择背叛是占优策略2、存在一个合作解,使双方的收益都优于其在占优策略均衡下的收益,即:al<a4,bl<b4如果双方能够选择合作,本可以得到更好的结果。对称条件下的囚犯困境在一个2人双策略对称博弈中,如果满足以下条件:P>S>R>T,那么其占优策略均衡(R,R)就构成了囚犯困境。(个人理性与集体非理性)特别提示:表面上看囚犯对自身利益的追求是导致囚犯困境的原因,其实,真正的原因是:囚犯们在追求自身利益的同时,以更多地损害他人利益为代价。(君子爱财,取之以道)特别提不:囚犯困境的根本原因在于:私人成本与社会成本的差异,即个人行为的负外部性。特别提示:损人利己和损己利人本质上是一样的,是一个硬币的正反两面;从一方来看是损己利人的行为,在另一方来看是损人利己的行为,问题的关键是所损(失)的部分和所利(得)的部分哪个更多。(盗窃与抢劫)特别提示:如果有一种制度,在该制度下,每个人都只能通过利人才能实现利己的目标,这一定是一种好的制度。(市场的逻辑)第六章真实世界的囚犯困境第一节大萧条与凯恩斯革命一、大萧条二、凯恩斯对大萧条的解释1、消费需求不足2、投资需求不足3、价格刚性第二节价格战第三节独裁与多数人的懦弱第四节民主与多数人的暴政一、我所记忆的建国后开展的历次运动:土地改革运动(2)镇压反革命运动抗美援朝运动建国后第一次整风运动连队民主运动三查运动忠诚老实政治自觉运动清理“中层”运动(9)民主改革运动(10)电影武训传和宣传武训的批判运动(11)三自革新学习与教会民主改革运动(12)农业生产互助合作运动(13)文化教育战线和各种知识分子自我教育和自我改造运动(14)反贪污、反浪费、反官僚主义的三反运动(15)文学艺术界整风学习运动(16)爱国增产节约运动(0)教育、文艺、科学等方面在三反运动中仍进行思想改造学习运动(18)中央希望华东、中南、西北三大区在大规模的学校教师思想改造会议上,推动学校教师及教育行政人员的思想改造工作(19)反对行贿、反对偷税漏税、反对盗窃国家财产、反对偷工减料和反对盗窃国家经济情报的五反运动(20)反对违法乱纪运动(又称新三反)(21)整党建党运动(22)学习运动(23)从批判胡风文艺思想到肃清胡风反革命集团运动(24)肃清暗藏的反革命分子运动(25)胡适思想批判运动(26)整风运动(27)反右派运动(28)工商界整风运动(29)以除四害为中心的爱国卫生运动(30)大跃进运动(31)人民公社化运动(32)农村工具改良运动(33)农村社会主义和共产主义教育运动(34)反对右倾思想运动(35)增产节约运动(36)养猪运动(37)整风运动(38)整风整社运动(又名农村三反运动)(39)技术革新和技术革命运动(40)爱国卫生运动(41)工业企业学解放军运动(42)学习雷锋运动(43)干部参加劳动运动(44)农村社会主义教育运动(又名四清运动,在城市叫五反运动)(45)群众性设计革命运动(46)增产节约运动(47)文化大革命运动(48)清查"五一六”运动(49)批陈整风运动(50)批林批孔运动(51)开展对水浒评论的运动(52)“批邓、反击右倾翻案风”运动一摘录于胡甫臣对建国后历次政治运动的认识特别提示:民主必须与法治(不是法制)相辅相成,才能避免多数人的暴政。法治:RJieOflaw,是最高准则,最高理念,社会意识法制:rulebylaw,通过法律治理国家,是统治的工具第七章如何破解囚徒困境第一节如何利用他人的囚犯困境货比三家分而治之第二节如何破解囚犯困境一、道德教化(文化建设)社会学基本定理金迪斯(H.Gintis):如果一个社会都是由自利主义者构成的,那么,长期而言,这个社会将消亡。而如果一个社会,通过“说服教育”以及其他说教机构的努力,长期保持一定比例的利他主义者,它就能够稳定地繁衍下去。二、财产私有(制度建设)圈地运动(个人成本与社会成本相一致)人民公社(偷懒是一种占优策略)三、温故知新1、让历史告诉未来(重复博弈)2、学习博弈论基础课程第四讲万元陷阱和智猪博弈第八章万元陷阱自古以来,人类为捕杀动物所设的陷阱,有三个特征:有一个明显的诱饵。通往诱饵之路是单向的,可进不可出。越想挣脱,就越陷越深。沉没成本效应与路径依赖投资已经过半之后,如果要改变投资方向或暂停投资,都是一个颇为困难的事儿。沉没成本和转移成本的比较沉没成本是指由于过去的决策已经发生了的,而不能由现在或将来的任何决策改变的成本。我们把这些己经发生不可收回的支出,如时间、金钱、精力等称为“沉没成本”(SunkCost)o在经济学和商业决策制定过程中会用到“沉没成本”的概念。沉没成本会导致路径依赖。转移成本是消费者在购买一件商品以取代原有商品的过程中,过渡所需要支付的费用。Paulklemperer基于经验产品的角度解释转移成本的构成:第一、学习的成本。如从QWERTY键盘转移到DVOrak键盘将花费的培训和学习费用,这已经成为市场失灵的经典案例。第二、交易的成本。如更换供应商所面临的风险以及交易费用。第三、机会成本(ArtificialSwitchingCost)o如“老客户优惠”的损失等。这里的转移成本应该是消费者承担的成本和新供应商承担的成本总和。转移成本衡量了顾客对某一位供应商的锁定程度。转移成本是对路径依赖程度和锁定程度的衡量。社会心理学家泰格(ATeger)对参加拍卖游戏的人加以分析,发现掉入陷阱'的人通常有两个动机,一是经济(理性)的、一是非经济(感性)的。经济动机包括渴望赢得钞票、想赢回他的损失、想避免更多的损失;非经济动机包括渴望挽回面子、证明自己是最好的玩家及处罚对手等。心理学家鲁宾(确立你投入的极限及预先的约定:譬如投资多少钱或多少时间?极限一经确立,就要坚持到底。(止损)f止盈容易止损难!原因:贴现;人对亏损比盈利要敏感得多(亏损带来的难受程度不等价于同样收益带来的满足程度)。人在正常情况下是厌恶风险的,但是一旦亏损,会立马从一个厌恶风险的人转变成一个偏好风险的人。学会止损会让你活得更久!3.自己打定主意,不必看别人。特别提示:既然事情已经发生,请坦然接受!特别提示:每个人都有犯错的时候,请把注意力放在以后如何避免犯同样的错!蒋文华的补充建议是:不要指望能够以很低的价格买入。(绞刑架,可竞争市场)尽快传递,势在必得'的信号。(破釜沉舟)只争馒头不争气,没了馒头终断气。(务实)高瞻远瞩,深谋远虑。(三思而后行)特别提示:抢占成本的最低点,就是抢占竞争的制高点第九章智猪博弈第一节智猪博弈:多劳不多得特别提示:智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。第二节智猪博弈的扩展1、当ANlo时,大猪小猪都选择不去按。2、当6WA<10时,双方都选择等待。3、当1WA<6时,小猪等待,大猪去按。4、当A<l时,任一方去按的收益都大于0。(斗鸡)若干启发个体理性与集体理性相冲突,还是相一致,取决于制度安排(游戏规则)。解决个体理性与集体理性之间的冲突不是靠否定个体理性,而是靠修改制度(游戏规则),从而在满足个体理性的基础上实现集体理性。从智猪博弈中还可以发现,在A<10时,任一方去按都是集体理性的选择,而收入分配的不均将有助于减少个体理性与集体理性的冲突。特别提示:搭便车的同时,别忘了给对方以回报。特别提示:富人愿意行善,离不开穷人的点赞。特别提示:能力越大,责任越大。第三节实例分析一、山寨现象(盗版)二、网络购物三、抄(复印)笔记四、汽车定位系统五、好货不便宜,便宜没好货第五讲懦夫博弈和性别战第十章懦夫博弈第一节基本模型鹰鸽博弈当A>C时,老鹰一老鹰是纳什均衡。当A<C时,老鹰策略的概率*=AC°(均衡结果)JtA老鹰=(A-C)+(l)X2AJlA鸽子=0+(1-)A两点推论:1、A增加,双方采取老鹰的概率会上升;2、C增加,双方采取老鹰的概率会下降。课堂讨论:1、C增加后,对双方有好处吗?Q=ACJIA鸽子=(l-)A=A(1-AC)各自的期望收益=A(1-A/O故C增加对双方有好处。核恐怖带来的恰恰是核安全。人的理性其实是从试错中慢慢总结出来的。(用脚投票)课堂讨论:2、A增加后,对双方有好处吗?各自的期望收益=A(1-A/O当AWC增加时,对双方有好处;当A>C2增加时,对双方没有好处。特别提示:奖励要适度,过犹不及。特别提示:赢者通吃的行业,容易出现过度竞争(WinneNake-all)赢者通吃的行业(能够低成本复制的行业):运动员、搜索引擎、通讯行业、软件行业、公开课、互联网、畅销书、演艺界、博彩业、战争、竞技体育(二八现象:20%的人获得了80%的收入)非赢者通吃的行业:教育行业特别提示:竞技体育很多时候就是个万元陷阱,除非它本身就能给你带来快乐!特别提不:奥运会就是一帮最需要运动的人在观看一帮最需要休息的人在剧烈运动。第二节实例分析一、路权之争二、谁打电话三、责任分散效应第三节公共物品的提供一、公共物品的特点1、非排他性2、非竞争性二、谁来提供1、囚犯困境(需要政府提供)2、智猪博弈3、斗鸡博弈类似的例子(竞争关系)1停车占位(协调机制)2、升官发财(选拔机制)3、找工作(招聘管理)4、抢市场(竞争机制)5、填志愿(录取机制)第十一章性别战第一节基本模型第二节实例分析类似的例子(合作关系)1、约会2、恋爱与结婚3、聚餐4、通讯(MSN)5、语第三节扩展分析1、农户的产品选择(规模与合作)f在市场容量以内种一样的是有规模经济的(合作关系),如果超过容量以后一起种,效率会下降,应分开种不同的(竞争关系)2、休假制度(团聚与旅游)3、有效需求(长尾理论,余额宝)一长尾理论:降低成本后,有更多的需求能得到满足4、盲人摸象与知识生产第四节均衡的存在性和多重性均衡的存在性定理每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)(纳什,1950)在n人战略式博弈中,如果每个参与人的纯战略空间Si是欧氏空间上一个非空的、闭的、有界的凸集,损益函数Ui(S)是连续的且对Si是拟凹的,那么,至少存在一个纯战略纳什均衡。(Debreu,1952;Glicksberg,1952;Fan,1952)在n人战略式博弈中,如果每个参与人的纯战略空间Si是欧氏空间上一个非空的、闭的、有界的凸集,损益函数Ui(S)是连续的,那么,至少存在一个混合战略纳什均衡。(Gllcksberg,1952)均衡的多重性“聚点”均衡(谢林点):1、文化、历史(接人)2、道德(出门)3、法律(右行、斑马线)特别提示:法律不被信仰,形同虚设!第六讲混合策略和监督博弈第十三章混合策略第一节概念及说明纯策略和混合策略纯策略:如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动。混合策略:如果一个策略要求参与者在给定信息情况下以某种概率分布随机地选择不同的行动。石头剪刀布百战百胜策略简单说,如果你的剪刀输给了对手的石头,那么下一轮你更有可能出能战胜石头的布;而如果你是获胜者,那么下一轮你更有可能沿用相同的出手。赢家保持现状输家做出改变的策略(胜留败走)。石头剪刀布的制胜策略:如果你是输家,下一轮换用能打败对手的出手;如果你是赢家,下一轮不要再使用原来的出手。也就是说,你用石头打败了对手的剪刀,那么下一轮你不能再出石头,而应该出剪刀,因为对方很有可能会出布。特别提示:小得失相信人,大得失怀疑人!均衡结果:游戏玩久了,赚钱就难了。(红海)第二节扩展分析一、智猪博弈中的混合策略二、懦夫(斗鸡)博弈中的混合策略特别提示:利益冲突需要协调,协调成本过高,不如不协调。特别提示:能够降低协调成本的制度(技术),是一种更好的制度(技术)。第十四章监督博弈第一节征税博弈第二节雇主与雇员的监督博弈3个问题:1、求解混合策略纳什均衡。混合策略均衡解:当雇员以C(W+F)的概率偷懒,雇主以H(W+F)的概率检查,达到均衡状态。若干推论:H越大,雇主越容易检查。C越大,雇员越容易偷懒。W越大,雇员越少偷懒,雇主越少检查。F越大,雇员越少偷懒,雇主越少检查。雇主检查的概率=H(W+F),雇员偷懒的概率=C(W+F)2、雇主支付W为多少时,其期望收益最大?V-W即雇主所赚到的钱,V即雇员偷懒给雇主带来的损失,V-H为劳动力的剩余价值。若干推论:V越大,工资越高。C越大,工资越高。C越大,雇员越容易分享到剩余价值。越是难以被监督的职业越需要职业道德。3、如何理解雇员所交的抵押金?特别提示:选一个容易偷懒的职业,并努力不偷懒,你离成功就不远了!选一些难学的专业,读一些难懂的书,成功的路上并没有你想象的那么拥挤!第七讲最后通牒与讨价还价第十五章最后通牒第一节最后通牒的含义最后通牒博弈(Ultimatumgame)是指两人分一笔总量固定的钱,比如IOO元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果不同意的话,两人都将一无所得。第二节最后通牒的实验结果实验表明,大多数A分配给B的钱在40-50元之间,给50元以上的情况极少见,如果分配数量小于20元,方案被拒绝的概率很高(约40%-50%),拒绝的可能性随着钱数的减少而不断增大。特别提示:人在博弈中,还会追求利益以外的价值L弗兰克(Frank)分桔子汁的实验。2、季军比亚军更快乐!3、序位消费理论(困扰我们的,不是如何能够过上幸福的生活,而是如何能够过上比别人更幸福的生活。)4、复仇与公正(正义、公平)一个没有信仰的人很难理解一个有信仰的人的思维和行为!特别提示:人与人之间最根本的冲突是价值观的冲突特别提示:每个人可以有和别人不一样的价值观一个国家要有一个相对统一的价值观特别提示:越是成熟的组织(社会),在管理中越是更多地运用最后通牒的博弈。特别提示:最后通牒一方面可以节省大量的谈判成本,另一方面还可以给人以公平感。决定您出价高低的是:贪婪与恐惧!分配方法:蛋糕越大,给对方分配的比例可以越小当给对方分配的比例小到一定程度以后就不能再小下去了,我们一定要学会适可而止,否则会过犹而不及特别提示:职务提升制度直接影响组织的管理效率。尽可能建立基于绩效和能力的职务提升制度,并坚持公开竞争性原则。权力的基础孩子问:为什么非要听你的?谁承担决策的后果(出了问题谁负责?),谁负责决策!第三节独裁者博弈一、独裁博弈的设计两人一组分IOO元,提议者提出分配方案,分给响应者X元,留给自己IOO-X元;而无论响应者同意与否,提议者都将到自己的IOO-X元。显然,此时提议者不会遭遇响应者的彳丑可威胁。基于纯粹利己的标准的博弈理论所得到的结果将是提议者分给响应者0元(X=0)。实验结果表明,这种极端的分配结果仅占20%,而分给响应者大于0元但小于50元的提议者占80%,没有提议者愿意分给响应者50元以上。这说明,与最后通牒博弈相比,独裁博弈中由于提议者不用担心响应者的回绝,他们倾向分配给响应者更少的份额,但并不是极端自利地一点也不给响应者一尽管他可以这么做。三个道理:第一,人们在决定其行动时,并不会仅仅考虑到其经济利益,虽然这可能是最主要的一个考量,他们也会考虑一些道德和社会规范,比如公平原则,"己所不欲,勿施于人”。第二,一个社会如果在制度安排上能够给人民更多可以拒绝(可以说"不")的权利,那么这个社会就会产生更多的公平性,甚至会带来更多的效率改善。第三,一个社会在制度安排上给了官员更多可以拒绝(可以说"不")的权力(比如行政审批制度),那么拥有审批权的官员一定能够从中获利丰厚。(如社会抚养费)第十六章讨价还价讨价还价(Bargaining)也称为议价或谈判,主要是指参与者通过协商方式解决利益的分配问题,称讨价还价时主要强调其动作或过程,称谈判时则强调其状态或结果。第一节均衡解用X表示参与者1所得的份额,(I-X)为参与者2所得的份额,Xi和(1-Xi)分别是时期i时参与者1和参与者2各自所得的份额。假定两个参与者的贴现因子分别是l和62。这样,如果博弈在时期t结束,参与者1的支付的贴现值是卜匕=用TXt参与者2的支付的贴现值是上七=成T(I-XJ双方在经过无限期博弈后,得到的纳什均衡解为:参与者1获得的份额X*=(l-2)/(l-l2)推论:谈判时有先动优势,先开价的人比后还价的人更有优势(证明:当l=2=时,X*=l(l÷)>l2);越小(越没有耐心),先动优势越明显假设l=l,X*=l,即当第一个人有无限耐心的时候,整个蛋糕就都归第一个人了假设2=l,X*=0,即当第二个人有无限耐心的时候,整个蛋糕就都归第二个人了当bl=2=l,这时候就比谁先死,谁寿命长了在这个博弈中,谁更有耐心,谁最后拿到的份额就越多在讨价还价中,总能找到一个均衡解统一的价值观的实现:只要我们通过不断地交流和沟通,总能达成一致意见知识的互补性:每个人对世界的认识都是局部的、片面的,我们在跟别人讨论问题的时候,一定不要把讨论的焦点放在争论谁是对的上面,而应该放在彼此的交流和沟通上面,这样我们对事物的认识就更全面、充分、完整。当意见相左时,我们至少可以尊重彼此不同的看法,求同存异。孔子日:"君子和而不同,小人同而不和。"第二节贴现因子贴现因子是指1个份额经过一段时间后所等同的现在份额。贴现因子是由参与者的“耐心"程度所决定的。一个人对眼前利益和长远利益的比较(贴现因子)由哪些因素决定?L年龄(寿命)2、财富3、未来收益的确定性(法治)4、知识水平(文化程度)特别提示:组织相对于个人有更长的寿命预期,从而提高了人们的贴现因子。特别提示:"磨刀不误砍柴功,误与不误,取决于你想要砍多少柴!第八讲重复博弈和制度建设第十八章重复博弈第一节重复博弈重复博弈(repeatedgame):是指同样结构的博弈重复许多次,其中的每次博弈称为"阶段博弈(stagegames)o重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。基本特征L前一阶段的博弈不改变后阶段的博弈结构2、所有参与人都能观测到博弈过去的历史3、参与人的总损益是所有阶段损益的贴现值之和第二节重复博弈:以囚犯困境为例可选择的策略雷锋策略曹操策略冷酷策略(grimstrategies),又叫触发策略心太软策略一报还一报(Tit-fortat)人鬼策略欺软怕硬(又叫检验者战略,TESTER,先背叛)镇定者策略(先建立信任关系,然后想办法占小便宜)精神病患者(醉汉策略)T不知好歹、高深莫测的人重复博弈(repeatedgames)如果两个程序都合作则各得3分,如果都背叛则各得1分,如果一方背叛而另一方选择合作,则背叛方得5分而合作方得O分。每轮进行200次博弈,在总共提交的14个程序中(心理学、经济学、政治学、数学、社会学),最后发现,一个名为"针锋相对"(tit-for-tat,也称"一报还一报,多伦多大学心理学教授阿纳托尔拉帕波特)的程序获得的分数最高。在此后的第二轮比赛中,62个来自不同6个国家的程序的角逐中,"针锋相对依然稳获胜利)0"一报还一报”的4大特点1.它是善良的(前15名中只有一个非善良(第8),善良与得分的相关性是0.58)(不树敌)2.它是可激怒的(防背叛)3. 它是宽容的(给机会)4. 它是清晰的(易辨识)"针锋相对"的善良性防止他陷入非合作的麻烦中,对对方背叛的报复则保证了对方背叛行为的谨慎性,宽容性则有助于在对方背叛后重新开始合作,而简单清晰的规则则易于被人理解,从而导出长期的合作。四点忠告1. 不要嫉妒2. 不要首先背叛3. 对合作和背叛都要给于及时的回报(assoonaspossible)4. 不要耍小聪明两点启示合作的基础不是信任,而是关系的持续性。组织相对于个人而言往往具有更长的预期寿命,从而提高了关系的持续性。(网购与网店)对冷酷战略的进一步分析突然选择不合作的总收益R=5持续合作的收益R=3+3+3+3合作还是背叛?对冷酷战略的分析突然选择不合作的总收益R=5持续合作的收益R=3+3+32+3n=3/(l-)贴现因子的另一层含义是下次博弈的可能性在什么条件下双方会永远合作?>25特别提示:当眼前的诱惑足够大时(即R足够大时),人性通常是经不起考验的。如何处理噪音?宽容悔晤宽容比悔悟表现好(0.1-1)悔悟比宽容表现好(I-IO)噪音导致原谅,但是太多的原谅会被利用。(宽严相济)第十九章制度建设思考问题方式:现象一行为一制度特别提示:不要去责备人的利己/心,如果一种利己的行为,导致了恶劣的结果,要改变的是制度。特别提示:优秀的管理者不是要消灭人的利己/心,而是要充分利用人的利己氏利己心既能让人去杀人,也能让人去助人;既能让人说谎,也能让人说真话。特别提示:制度好可以使坏人无法横行,制度不好可以使好人无法充分做好事,甚至会走向反面。党和国家领导制度的改革,邓小平不要试图改变人性,而是努力改变制度。不要让人不想贪,而是让人不能贪、不敢贪人终有一死,我们会被他人取而代之。因此我们不能传承个人的经历,因为它将随我们而去,我们能够留下的只是制度。-让莫奈欧洲联盟人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大限度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体福利的增加。计算机之父、博弈论创始人之一冯诺伊曼结束语人生是永不停息的博弈过程,博弈的精髓不是通过暴力或阴谋诡计去战胜对方,而是如何共同努力去建立起更好的游戏规则,实现民富国强与社会和谐的共同目标。博弈的最高境界:双赢