本文目录一览:
- 1、《囚徒困境》txt下载在线阅读全文,求百度网盘云资源
- 2、什么是“囚徒困境”,举出你在社会生活中观察到的“囚徒困境”的例子。
- 3、囚徒困境的定义
- 4、囚徒的困境——与其背判是什么意思?
- 5、《囚徒的困境冯·诺依曼、博弈论和原子弹之谜》epub下载在线阅读全文,求百度网盘云资源
《囚徒困境》txt下载在线阅读全文,求百度网盘云资源
《囚徒困境》百度网盘txt 最新全集下载:
链接:
提取码: 4aiv
简介:囚徒困境作者:四十九盏灯。
恋爱是囚徒的博弈,
如果两人都选择深爱,他们将收获爱情,
如果两人都选择背叛,他们将无爱无恨,
坏就坏在,
如果一人选择深爱,一人选择背叛,
那选择爱的人,将会被判无期徒刑。
萧进说:姜辰长成这样,都是韩韶军宠的。
什么是“囚徒困境”,举出你在社会生活中观察到的“囚徒困境”的例子。
囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。
例子:北大清华的状元之争是一个典型的囚徒困境。囚徒困境是社会合作面临的最大难题,它深刻揭示了个体理性和集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是自己最想要的结果,相反可能导致集体的非理性。
就生源竞争而言,对于北大来说,无论清华抢不抢状元,抢状元都是北大的最好选择,即最优战略;对于清华来说也是一样。
用博弈论的专业术语来表述,(抢状元,抢状元)构成了北大清华招生博弈的纳什均衡。纳什均衡是一个僵局,给定对手不改变行为,自己就没有激励改变行为,因而无法打破或单独偏离均衡。
纳什均衡最深刻的悲剧性在于,北大和清华都意识到抢状元是毫无意义的,但抢状元却是他们必然的选择。
即使两所大学都认同不抢状元是最好的,但这个结果却得不到,因为每所大学都不得不采取对自己最有利的行动——抢状元。除非引入第三方力量改变博弈结构,否则囚徒困境就不可能被打破。
扩展资料
相关应用:封闭交易
霍夫施塔特曾提出,像囚徒困境一类的问题,若以简单博弈的形式来说明,人们会较容易理解。例如他以“封闭袋子交易”的简单博弈来说明此论题:
两人面对面互相交换封闭的袋子,共同了解其中一方放钱,另一方放商品。双方可以诚实的依照承诺,把东西放到袋子里交换;又或者交空袋子给对方,选择背叛。
在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。
参考资料来源:百度百科-囚徒困境
囚徒困境的定义
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
【经典的囚徒困境】
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
【解说】
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、我背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。例子华丽地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的。
囚徒的困境——与其背判是什么意思?
在囚徒困境中,选择招供,也就是背判是理性的,这一论断与我们的传统观念并不相等。如果人人都这样想问题,那么就没有诚信可言了。
出现这一问题的原因是:现实中的情况和囚徒困境并不一样,困境中的两个囚徒互不相识,被判出狱后可能老死不相往来。现实生活中却并非如此,人们都在进行着重复的博弈,就是同样结构的博弈也要重复多次,人们可能在次数不定的博弈中与其他人重复交手。
其实“善有善报”的观念并不是一种迷信思想,从另一个角度看,它是有科学依据的。
《囚徒的困境冯·诺依曼、博弈论和原子弹之谜》epub下载在线阅读全文,求百度网盘云资源
《囚徒的困境》([美国] 威廉·庞德斯通)电子书网盘下载免费在线阅读
链接:
提取码: spq5
书名:囚徒的困境
作者:[美国] 威廉·庞德斯通
译者:吴鹤龄
豆瓣评分:7.6
出版社:北京理工大学出版社
出版年份:2005
页数:358
内容简介:
本书用简明易懂的方式阐明了博弈论,是一部真正具有独创性的作品,体现在它以丰富的史料,开阔的视野和合乎逻辑的分析,以生动和直率的方式向读者讲述了冷战的历史,核时代的策略游戏和冯·诺伊曼的生平。揭露了战后令人毛骨悚然的一些政府间的尔虞我诈,是一本关于博弈论及其在冷战和核军备竞赛中的作用的出色的社会历史教科书。
本书的视角十分广阔。作者围绕冯·诺伊曼的生平和博弈论这两条主线,实际上向读者展现了二战以后、冷战初期国际政治舞台上的矛盾和冲突,并试图分析其根源。这部书让我们比较详细地了解了美国以至整个西方在战后围绕要不要发展原子武器,围绕关于“先发制人的战争”所展开的大辩论,比较详细地了解了20世纪60年代初震动全世界的古巴导弹危机的经过和内幕。
作者简介:
威廉姆·庞德斯通(William Poundstone),曾在麻省理工学院学习物理学,定居于洛杉矶。他为世界各地的报刊、杂志以及美国电视台撰稿。迄今为止,庞德斯通已出版10部著作,包括关于信息论和物理学的《循环的宇宙》、揭示科学中的悖论的《推理的迷宫》,以及畅销书《巨大的秘密》、《终极》等,其中有两部获普利策奖提名。最近的一部著作是《运气公式:在赌场和华尔街制胜的科学下注方法秘闻》(2005年)。
吴鹤龄,毕业于北京工业学院(现北京理工大学)自动控制系计算机专业,后留校任教直至退休。近期主要著作有:《ACM图驱奖——计算机发展史的缩影》,《IEEE计算机先驱奖——计算机科学与技术的发明史》,《好玩的教学:娱乐数学经典名题》,《七巧板、九连环与华容道:中国古典智;力游戏三绝》等。