博弈论的囚徒困境和懦夫游戏有什么区别

博弈论的囚徒困境和懦夫游戏有什么区别,第1张

好吧,虽然不太了解你的比方,我臆测一下,然后回答你吧。(1)智猪博弈的理论:part1(理论的模型我就不讲了吧)理论解析:在于小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待严格优于行动(dominatingstrategy);在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,这个时候小猪的等待成为了dominatingstrategy。这个博弈事实上是说明有时候等待也是一种好选择。part2事实联系:将捐款设为按钮,将他们获得的社会名望设为饲料,他们捐出去的钱为成本,对比来看。若是大企业家裸捐时,媒体争相报道,他的社会名望提升是非常巨大的。(陈光标)若是一般人裸捐呢?单从社会名望来说,完全是不起眼的,而对于你自身家庭损害却是极大。所以裸捐不可强求于任何人。(2)实在不能理解这和酒驾有什么联系。。。这不是一个竞争范围啊。。。(3)part1理论解析:囚徒困境是指在不可调谐(communication)的情况下产生的矛盾。part2我有点不理解你的题目是否出错,同样不拥有对象,除非你说的是防止沉迷网络系统的诞生情况。(4)我真没学过。。。你可不可以解释一下。(难道是臭氧层空洞的威胁,分析打成了缝隙?)ps:只是高中生,学过博弈论而已。

关于什么是囚徒困境,因为我大学学过博弈论,我这里简单分析下,囚徒困境属于博弈论其中一种模型:
两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
从个人利益出发,揭发是对自己最有利的方式,但是从整体利益看来,同时沉默则是最好的方式。

家电价格战
彩电行业是寡头控制,国内几大厂商控制了70%的市场份额,因此彼此间的博弈互动更为突出,1999年4月,长虹为扩大市场份额,宣布彩电产品降价,对整个彩电行业造成巨大震动,随后康佳、TCL和创维建立彩电联盟,坚决不降价。直到4月20号上午,康佳仍表示不降价,但是当晚就改变主意,使得TCL和创维措手不及,价格战立即蔓延开来。
大家都降价对于各自的扩大市场没有多大帮助,反而使得利润都被削弱,1996至2000年,彩电行业发生态的大的价格战达到8次以上,整个行业的利润都被打打削减,全行业为亏损状态,整个行业利润减少了147亿元。
既然大家都没得到好处,为何还要打价格战呢?这就可以用囚徒困境博弈模型解释。因为从各商家个人利益出发,降价是最有利自己的。
此外,之前一段时间美团和饿了么红包战也可以看做这个模型。

教育问题
不让孩子输在起跑线上也是典型的囚徒困境博弈模型,大家都知道孩子们应该有个快快乐乐的童年,但父母们为了孩子能够考上好大学,逼迫孩子们从小学这学那,于是真个教育界都变成这样。

乘坐公共汽车
本来大家都知道排队会更加顺利,但是由于大家缺乏行动的一致性,结果造成整个上车拥挤不堪。
总结:囚徒困境模型可以解释很多日常中很多人都选择以个人利益为主的不合理的行为。

有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。

如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。

但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。

这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。

综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。

这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

扩展资料

关于纳什平衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什平衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什平衡在n人有限博弈中的普遍存在性。

从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”

参考资料来源:百度百科--纳什均衡

1,差别定价 理论的 案例应该不少,根据不同的目标客户制定不同的价格,比如尼康,有针对各种客户群制作不同型号相机,差别定价。(这个因为不太记得差别定价的定义所以只能做参考)
2,囚徒困境指的是 个人所做的最有决策对于整体来说并不是效率最大效果最优的,解决的方法应该是相互合作。囚徒困境里的两个人都在进行一项最简单的博弈,就是通过对对方行为的分析来做决策,其结果虽然对于他们自己来说是最好的最合理的,但是对于我们局外人来看却不是最优的,解决的方法就是双方沟通互相信赖并且达成一致,但在这个故事里不是不可能的,因为跟故事设定的前提相悖。

警察抓住了两个小偷,并承诺首先指控对方罪行的小偷会获得奖励。假如两人都保持沉默,最终两个人都会被释放。如果两个人都指证对方,那么他们则都会被判刑。警察利用奖励来刺激小偷互相告密。从个人选择角度而言,告密是更有利的选择,但如果两个人都这么做,那么他们就都会被判刑,这是个双输的局面。在这个博弈案例囚徒困境中,嫌疑犯通过理性判断做出的选择被证明是一个错误的选择。《科学美国人》(ScientificAmerican)特约编辑乔治穆瑟(GeorgeMusser)撰文认为,现在,囚徒困境可以通过量子纠缠来解决。一个最新并且还在不断更新的研究表明,量子投票系统可以避免传统投票行为中的各种不协调。相比于传统逻辑学——不能很好地解释人类为什么会选择合作与无私,量子力学可能是一个描述人类行为的更好模型,它并不要求人们只在传统理性框架下思考,还扩充了人们对于理性的理解。回顾整个20世纪,科学家和数学家也不得不承认,有些事物超出了理性的范畴。早在20世纪30年代,库尔特特哥德尔(KurtGodel)指出,哪怕是对于数学这个充满逻辑的理性世界,一旦通过深入思考消灭掉一个悖论,就必然会有新悖论冒出来,例如哥德尔的代表工作——不完全性定理:即使把初等数论形式化后,系统中还是存在着悖论,既无法证明它为真,也无法证明它为假。经济学家和政治理论家在构建社会时,也发现了理性原理带来的局限性。科学史学家则进一步戳穿了一个以往的科学信仰——科学争论仅仅依靠事实来解决。理性原理的这些局限性最终来源于量子物理——有些事情就是会无缘无故地发生,你并不知道是怎么回事。以上情形在最近十年发生了巨大改变。人们原以为,奇特的量子力学会束缚我们的认知力,没想到它反而解放了我们的思想。它不仅拓展了人类对于物理世界的理解,也加深了我们对于自身的认识。量子理论大大地丰富了理性思考的内容,带领人类走出了理性的死胡同,为我们提供一个更为广阔的认知平台。18世纪末的杰出法国数学家马奎斯·德孔多塞(MarquisdeCondorcet)曾指出民主投票体系中存在着悖论:统计所有人的选择后,可能出现循环套的无解局面。意大利都灵大学的数学家和政治评论家皮耶尔乔治奥迪弗雷迪给出这样一个例子:在1976年的美国总统大选中,经过和罗纳德 里根(RonaldReagan)一番激烈的党内竞争,杰拉德福特(GeraldFord)获得了共和党的总统提名权,但在其后的大选中福特输给了民主党候选人吉米卡特(JimmyCarter)。不过,民意调查显示,如果1976年是里根最终参选的话,那么他将击败卡特,就像 1980年的美国大选一样。选民的偏好并没有传递性:喜欢卡特胜过福特加上喜欢福特胜过里根,并不意味着一定喜欢卡特胜过里根。卡特的最终当选只是因为先要进行党内初选。谁最终当选总统仅仅取决于这两场选举的先后顺序,而不是取决于选民。囚徒困境证明了,自由放任的经济政策(laissez-faireeconomics)具有很大的局限性,同时也指出了新古典主义经济学(neoclassicaleconomic)里面主张支持自由市场经济,个人理性选择,反对政府过度干预中存在的一个错误——只要每个人理性地做出自己的最优选择,必然将是集体的最优选择。在上世纪五六十年代,数学家提出了各种办法,试图解决囚徒困境,其中一种办法就是运用有条件性的决策。两个嫌疑犯不再只有沉默和指证对方两种选择,每个嫌疑犯还可以告诉警察说:“假如我的同伴保持沉默,那么我也保持沉默。”一旦小偷有了“基于某些条件再做决定”的权利,那么他们就可以避免牢狱之灾。重要的是,此时两人都不需要再多想其他策略,基于个人利益的理性选择必然会带来两人之间的合作,个人的最优选择必然会带来集体的最优选择。但上述设想的最大问题在于,两人必须坚持这种条件性决策,而不能在最后时刻改变想法指证对方。所以,他们需要一种非常安全的方式,让两人的决策时刻保持一致。量子物理就提供了一种安全的方式。1998年,德国波茨坦大学的物理学家延斯艾泽特(JensEisert)、马丁 维尔肯斯(Mar-tinWilkens)以及德国汉诺威大学的马切伊莱文施泰因(MaciejLewenstein)提出,可以使用一对处于量子纠缠态的粒子对,来保证决策的一致。量子信息学告诉人们:为了进行远距离的量子密码通信或量子态隐形传输,人们需要事先让距离遥远的两地共同拥有最大的“量子纠缠态”。所谓“量子纠缠”是指不论两个粒子间距离多远,一个粒子的变化都会影响另一个粒子的现象,即两个粒子之间不论相距多远,从根本上讲它们还是相互联系的。例如,一个无自旋的粒子分裂成两个粒子,它们的自旋一定相反。但在观测到它们的自旋前,它们是随机的,对一个粒子的观测会瞬时影响到另一个粒子。科学家们认为,这是一种“神奇的力量”,爱因斯坦都无法解释,将其戏称为“遥远的鬼魅行为”。意大利数学物理学家加夫里塞格雷(GavrielSegre)认为,使用一种类似的方法,在不需要独裁制的情况下,就可以避免投票中出现连环套僵局。塞格雷认为,量子物理学增加了可能的投票方式。就像薛定谔的猫一样,每个选民同时具有投赞成票和反对票两种想法,这就是所谓的叠加态。当投票开始时,选民的选择就会互相累加或者互相抵消。此时选民之间会形成纠缠态,这意味着选民会以一种合作的方式来投票。这种关联就像量子“囚徒困境”中的决策一致一样。在量子情况下,人们的选择就会变得很一致。不幸的是,塞格雷的证明还非常粗糙,一些研究投票博弈的专家都对此表示怀疑。但幸运的是,所有这些发现的重要意义在于,量子物理学提供了一种研究人类行为的新模型,在新模型里面,不理性的决策也变得有意义。在现实世界中,人们之间的相互合作,远比单纯依靠理性的利己主义原则要多。当心理学家要求志愿者做囚徒困境游戏时,尽管理性的考虑更倾向于选择举报,但志愿者有时还是会保持沉默。2009年,英国伦敦城市大学的心理学家伊曼纽尔波托斯(EmmanuelPothos)和美国印第安纳大学伯明顿分校的心理学家杰尔姆布森耶(JeromeBusemeyer)共同提出了一个新的量子模型,来解释各种心理学实验的结果。这样的量子假设具有潜在的合理性,因为绝大部分人的选择偏好都不是一成不变的。人们的感觉是矛盾的,并受到周围人的影响。“我们是非常注重语境的生物”,布森耶这样介绍到,“所以在我们面对抉择之前,往往没有预设的立场”。量子力学中,叠加态的概念可以很好地描述这样一种混合的感觉。这并不是说我们大脑的构造像物理学家推测的量子计算机一样,只是量子物理为我们提供了一种研究人类想法易变性的有用方法。量子理论的奇特性质,丰富了人类的认知行为。它为许多难以解决的事情提供了多种可能的解决途径。这是经典理性逻辑做不到的。在某种程度上,这种新兴的量子认知科学,把量子物理学带回到了它的本源。在 20世纪早期,尼尔斯高玻尔(NielsBohr)和其他一些量子力学的创始人正是从心理学中获得了灵感。自从启蒙运动以来,理性主义时而是知识界的主流时而又不是,而量子力学就诞生在理性主义并不是很受欢迎的时期。第一次世界大战使得人们怀疑自我完善的能力。正是在这种情况下,玻尔和同僚建立了量子力学——这个理论导致人们认为自己的认知能力是有限的。然而,历史就像回到了从前,今天的量子物理学让我们重新乐观地审视人类的知识和行为,这也许有助于激发起一场新的启蒙运动。

主要有两个因素导致卡特尔具有天然的不稳定性:第一,潜在进入者的威胁:一旦卡特尔把价格维持得较高水平,那么就会吸引新企业进入这个市场,而新企业进入后,可以通过降价扩大市场份额,此时卡特尔要想继续维持原来的高价就很不容易了。第二,卡特尔内部成员所具有的欺骗动机:这是一个典型的“囚徒困境”,给定其他企业的生产数量和价格都不变,那么一个成员企业偷偷地增加产量将会获得额外的巨大好处,这会激励成员企业偷偷增加产量,如果每个成员企业都偷偷增加产量,显然市场总供给大量增加,市场价格必然下降,卡特尔限产提价的努力将瓦解。如果卡特尔不能有效解决这个问题,最终将导致卡特尔的解体。事实上,经济学家研究得出,世界上卡特尔的平均存续期间约为66年,最短的两年就瓦解了。此外,随着各国政府反垄断法的实施,卡特尔也可能因为违反了政府法律而被迫解体,也正因为如此,许多卡特尔都是国际性卡特尔,以规避国内的反垄断法。也可从博弈论角度分析这种不稳定性。因为(欺骗,欺骗)是一个纳什均衡。

"囚徒困境"不仅仅是个模型,它也是一个"思想实验",甚至成了一个"隐喻"或"框架"。什么时候会出现"囚徒困境"?如果合作的收益较小,背叛的代价较小,博弈的次数较少,参加博弈的人数较多,"囚徒困境"就更容易出现。博弈论也持一种悲观现实主义的世界观,它不承认人会大公无私地奉献,人与人之间充满了欺诈和背叛,但这样一种悲观的思想,却能推导出非常乐观的结论。博弈论告诉我们,即使这个世界很灰暗,但乐于合作的好人最终是会胜出的。为什么会是这样呢?

1 精读书介绍:《策略思维》
我先讲讲为什么博弈论可以成为我们的行动指南。我们之前讲过人性。人性只在幽明之间。从幽的角度来看,我们是无法预测他人的行为的。从明的角度来看,"他人有心,予忖度之",我们可以在一定程度上猜测别人的心思。博弈论就是在幽明之间观察人类行为的。博弈论的基本观点是,你在作出自己的决策时,必须把别人的决策考虑进来。博弈论在经济学、政治学、军备竞赛,甚至进化生物学里都有广泛的应用。这门学问需要用到的数学很复杂,但核心观点却简单清澈。

本周的精读书是迪克西特和奈尔伯夫的《策略思维》。《策略思维》的英文书名是Thinking Strategically。这是我读过的最有意思的博弈论普及读物,翻译得也不错。

2 囚徒困境:柴诃夫斯基已经招了

有一个苏联音乐家在各个城市间巡回演出。他在一个城市结束了演出,坐上火车,赶往另外一个城市。在旅途中,他闲得无聊,就掏出乐谱来看。这个奇怪的举动引起了克格勃的注意。克格勃以为他在看密码本。

于是,克格勃把他抓进一个小黑屋审问。克格勃问他:"老实交代,你是不是间谍?"音乐家莫名其妙,他说,我不是啊。克格勃说:"那你看的是啥?那个密码不是你写的?"音乐家叫苦不迭:"冤枉啊,那明明是柴诃夫斯基写的。"克格勃若有所思地点点头,走出了审讯室。过了没一会儿,这个克格勃又回来了。他得意地跟音乐家说:"我看你还是老老实实招了吧,柴诃夫斯基都已经招了。"

这就是博弈论里最有名的"囚徒困境"。假设克格勃真的把柴诃夫斯基也抓了起来,关在另一个审讯室里,那么,音乐家和柴诃夫斯基会不会招呢?我们先来看第一种情况,柴诃夫斯基和音乐家都不招。如果他们两个都不招,那么克格勃就只能判他们两年刑。

哎,不对啊?你可能会问:既然找不到证据,为什么要判他们两年刑?这是根据另一个苏联笑话。在苏联的集中营里来了一个新犯人。老犯人问他:你为什么被逮进来了?他说,我什么也没干啊。老犯人又问:那你被判了几年啊?他说我被判了五年。老犯人说,那肯定弄错了,你要是什么都没干,应该判两年。

这是插播一个笑话。讲完笑话,我们再回来看第二种情况。如果音乐家招了,还陷害柴诃夫斯基,说他是个里通外国的间谍,那么,音乐家告密有功,宽大处理,马上释放,可怜的柴诃夫斯基就会被判十年--谁叫他不先揭发别人呢。

这是第二种情况,那我们再来看第三种情况。如果他们俩都招了,那么克格勃就有他们的供词:既然你们都认罪,那就判你们五年徒刑吧。

于是,问题来了。如果你是音乐家,或者你是柴可夫斯基,你会怎么做?假如你不招,别人招,你判十年,别人无罪释放,你最倒霉。假如你招,别人不招,你无罪释放,别人判十年,你靠出卖朋友逃过一劫。如果你招,别人也招,你们两个都判五年。了解博弈论的朋友都知道,最后的均衡解是音乐家和柴诃夫斯基都会招供。为什么呢?假定你招,不管别人招不招,你的处境都比不招要好。这在博弈论里被称为占优策略,就是比别的策略都好。

你现在看一下文稿,里面有一张是对"囚徒悖论"的图示。我们来根据这个案例,分析一下为什么柴诃夫斯基和音乐家最后都会进了监狱。

R是双方合作时的收益,T是别人垫背你背叛时你的收益,P是双方都背叛时的收益,S是人家背叛你垫背时你的收益。比较这四种情况,你会发现,收益的大小依次是T、R、P、S。也就是说,最好的结果是你先背叛,其次是大家都合作,再次是大家都背叛,最倒霉的是人家把你出卖了,你还在帮人家数钱。

3 博弈论的三个要素

你看,之所以会有"囚徒困境",跟各方在不同策略下的成本和收益有关。在博弈论里,我们把这个叫做支付结构。支付结构是影响博弈结果的第一个要素。除了支付结构,还有博弈的次数、参与的人数,都会对博弈结果有影响。

我们先来看第一个要素,也就是支付结构。要是我们把"囚徒困境"的成本和收益改一下呢?比如说,我们假设,被审讯的是一对真心相爱的夫妻,他们宁肯一起坐牢,也不肯背叛对方,也就是R的收益比T大,那就不会出现"囚徒困境"了。或者,我们假设被审讯的两个人都是黑帮的成员,如果其中一个人背叛,即使他会被放出来,但出来之后就会被别的黑帮成员杀死,也就是说,背叛的成本为无穷大,那么,也不会出现"囚徒困境"。

第二个要素是博弈次数。如果这两个被审讯的人是萍水相逢的,彼此都是陌生人,那么,互相背叛的概率就会更高,但如果他们都是一个村子里的,抬头不见低头见,早晚还会再见面的,那互相背叛的概率就会降低。这就是为什么在火车站容易出现更多的骗子,但在小区里却不太会有骗子的原因。

第三个要素是参与人数。如果只有两个人接受审讯,他们达成串谋的概率相对较高,但是,如果是派出所严打,一次抓进来100个人呢,这100个人想要一起串供的概率就会大大降低。人上一百,形形色色,人数多了,监督起来就困难,想混水摸鱼的人也就会多。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/12858142.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存