首頁 現(xiàn)實(shí)

數(shù)學(xué)心

第五百六十六章囚徒困境（博弈論）

數(shù)學(xué)心 蔡澤禹 1052字 2021-06-02 19:22:41

　　囚徒困境是1950年美國蘭德公司的梅里爾·弗勒德（MerrillFlood）和梅爾文·德雷希爾（MelvinDresher）擬定出相關(guān)困境的理論，后來由顧問艾伯特·塔克（AlbertTucker）以囚徒方式闡述，并命名為“囚徒困境”。兩個(gè)共謀犯罪的人被關(guān)入監(jiān)獄，不能互相溝通情況。

　　如果兩個(gè)人都不揭發(fā)對方，則由于證據(jù)不確定，每個(gè)人都坐牢一年；若一人揭發(fā)，而另一人沉默，則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋，沉默者因不合作而入獄十年；若互相揭發(fā)，則因證據(jù)確鑿，二者都判刑八年。由于囚徒無法信任對方，因此傾向于互相揭發(fā)，而不是同守沉默。最終導(dǎo)致納什均衡僅落在非合作點(diǎn)上的博弈模型。

　　囚徒困境的故事講的是，兩個(gè)嫌疑犯作案后被警察抓住，分別關(guān)在不同的屋子里接受審訊。

　　警察知道兩人有罪，但缺乏足夠的證據(jù)。

　　警察告訴每個(gè)人：如果兩人都抵賴，各判刑一年；如果兩人都坦白，各判八年；如果兩人中一個(gè)坦白而另一個(gè)抵賴，坦白的放出去，抵賴的判十年。

　　于是，每個(gè)囚徒都面臨兩種選擇：坦白或抵賴。

　　然而，不管同伙選擇什么，每個(gè)囚徒的最優(yōu)選擇是坦白：如果同伙抵賴、自己坦白的話放出去，抵賴的話判十年，坦白比不坦白好；如果同伙坦白、自己坦白的話判八年，比起抵賴的判十年，坦白還是比抵賴的好。

　　結(jié)果，兩個(gè)嫌疑犯都選擇坦白，各判刑八年。

　　如果兩人都抵賴，各判一年，顯然這個(gè)結(jié)果好。囚徒困境所反映出的深刻問題是，人類的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性-聰明的人類會(huì)因自己的聰明而作繭自縛，或者損害集體的利益。

去APP,免費(fèi)暢讀 舉報(bào)

按 “鍵盤左鍵←” 返回上一章按 “鍵盤右鍵→” 進(jìn)入下一章按 “空格鍵” 向下滾動(dòng)

數(shù)學(xué)心

第五百六十六章 囚徒困境（博弈論）

第五百六十六章囚徒困境（博弈論）