首頁 現(xiàn)實(shí)

數(shù)學(xué)心

第五百六十六章 囚徒困境(博弈論)

數(shù)學(xué)心 蔡澤禹 1052 2021-06-02 19:22:41

  囚徒困境是1950年美國蘭德公司的梅里爾·弗勒德(MerrillFlood)和梅爾文·德雷希爾(MelvinDresher)擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克(AlbertTucker)以囚徒方式闡述,并命名為“囚徒困境”。兩個(gè)共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況。

  如果兩個(gè)人都不揭發(fā)對方,則由于證據(jù)不確定,每個(gè)人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確鑿,二者都判刑八年。由于囚徒無法信任對方,因此傾向于互相揭發(fā),而不是同守沉默。最終導(dǎo)致納什均衡僅落在非合作點(diǎn)上的博弈模型。

  囚徒困境的故事講的是,兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。

  警察知道兩人有罪,但缺乏足夠的證據(jù)。

  警察告訴每個(gè)人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴,坦白的放出去,抵賴的判十年。

  于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴。

  然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,抵賴的話判十年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。

  結(jié)果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。

  如果兩人都抵賴,各判一年,顯然這個(gè)結(jié)果好。囚徒困境所反映出的深刻問題是,人類的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性-聰明的人類會(huì)因自己的聰明而作繭自縛,或者損害集體的利益。

按 “鍵盤左鍵←” 返回上一章  按 “鍵盤右鍵→” 進(jìn)入下一章  按 “空格鍵” 向下滾動(dòng)
目錄
目錄
設(shè)置
設(shè)置
書架
加入書架
書頁
返回書頁
指南