創作內容

12 GP

認罪?不認罪?談囚犯困境和賽局理論

作者:伍德‧瓦懷特│2020-03-29 06:06:30│巴幣:24│人氣:561
  各位喜歡玩Game嗎?今天伍德說數要來帶大家看一看Game Theory是什麼──別誤會,這裡的Game不是RPG或Action Game之類的遊戲,也不是小孩玩的遊戲。沒錯,今天伍德說數要來和大家玩大人的遊戲*1。而是將大家的行動和結果整理起來,進而能讓我們分析的「賽局」。

一、什麼是賽局?
  日常生活中,我們行動的結果通常會受自己的選擇影響,但很多時候,即使我們做出同樣的選擇,結果也可能隨著他人的選擇而不同。舉例來說,你跟你的朋友約好在學校門口碰面,卻忘記約是在前門還是後門。在沒辦法聯絡對方的情形下,該到前門還是後門等呢?要是兩個人剛好心有靈犀都到前門、或都到後門就沒事;要是一個在前、一個在後,等不到人就尷尬了。
  所謂賽局(Game),就是將各個參加者(玩家;Player)的選擇及相應的報酬(Payoff)數值化,並整理起來以供分析。我們透過分析各個情況下,每個參加者最好的策略是什麼,進而給出建議或預測結果。在上述的例子中,假設碰到面讓你們兩人都很開心(以1表示),而沒碰到面讓你們兩人誤以為彼此失約(以-1表示)*2,我們可以將賽局整理如下:

你朋友
到前門
到後門

到前門
(1,1)
(-1,-1)
到後門
(-1,-1)
(1,1)

  我們習慣將左邊的玩家稱為玩家1、上面的稱為玩家2。左上角的(1,1)中,第一個1表示你(玩家1、左邊的玩家)很開心,第二個1表示你朋友(玩家2、上面的玩家)很開心,其他可以類推。一般我們會省略「你」和「你朋友」不寫,看起來比較簡單。這個例子裡,每個玩家都有兩個動作(Action)可供選擇,分別是到前門和到後門。比較複雜的賽局裡,玩家可以不只兩位,每個人的動作也可以不只兩種。

  寫成上面那樣的矩陣後,我們就能用下面提到的方法分析了。在正式進入前,我們先聊聊賽局理論是怎麼來的。它原先是數學家們在打牌時,用來分析彼此策略的工具;而到了19世紀,數學家古諾(Cournot)、柏特蘭(Bertrand)分別將這套方法用在分析廠商的勾結行為;賽局理論這個名字是由20世紀鼎鼎大名的科學家馮‧諾曼(von Neumann)在其著作給出,其後約翰‧納許(John Nash)定義了納許均衡,並證明了納許定理(1951年),可謂賽局理論的里程碑。

  雖然奠定基石的人大部分是數學家,現今賽局理論主要的應用在個體經濟學探討廠商勾結或群眾行為上。在政治學、生物學、資工領域也都有相關的應用。

二、囚犯困境(Prisoner's Dilemma)
  賽局理論中最著名的例子之一,是個被稱為囚犯困境的假想(?)實驗。在這個實驗中,兩人一組的偷竊慣犯某次失風被抓了起來,但由於過往犯罪的罪證不足,警方決定分開審訊兩位嫌疑犯,並給予他們兩個選擇:
  1. 選擇不認罪、抵死不認。
  2. 選擇認罪、指控對方。
  而結果有以下幾種:
  1. 兩個人都不認罪:各關1年。
  2. 一個人認罪、一個人不認罪:不認罪的那方關10年,認罪的一方因為提供罪證而直接釋放。
  3. 兩個人都認罪:各關5年*3。

  由於兩人都不喜歡蹲苦牢(應該沒人喜歡吧...?),我們把關1年寫成-1、關5年寫成-5、關10年寫成-10。可以將結果像上述一樣整理成下面的表格:

囚犯B
不認罪(合作)
認罪(背叛)
囚犯A
不認罪(合作)
(-1,-1)
(-10,0)
認罪(背叛)
(0,-10)
(-5,-5)
  注意右上角我們寫(-10,0),表示囚犯A因為不認罪而被關了10年、囚犯B因為認罪而被釋放。左下角的(0,-10)則相反。

  作為囚犯,該不該認罪呢?假設我們是囚犯A。
  要是囚犯B不認罪的話,我們也不認罪,會被關一年(-1);認罪的話就會直接被釋放(0)。這個時候應該要認罪*4。
  要是囚犯B認罪的話,我們要是不認罪會被關十年(-10);認罪的話會被關五年(-5)。看來還是認罪好一些些。
  綜合上述,不管怎樣就是要認罪。而囚犯A這麼想的同時,囚犯B也在這麼想*5。所以賽局理論預測的結果是兩個人都認罪,一起關5年

  但是你發現了嗎?要是兩個人一起不認罪,只要一起關1年就好。兩個人都比一起關5年的情況好。明明有一個更好的結果,兩個人卻到不了*6,這樣的結果也是這個賽局被稱為囚犯困境的原因。

三、納許均衡(Nash Equilibrium)
  納許談論賽局時,承繼馮‧諾曼提出最佳回應(Best Response)的概念,定義了納許均衡。
  所謂最佳回應,指的是神回應給定其他人的策略,自己應該怎麼做最好。用上面囚犯困境的例子來說,給定囚犯B認罪,囚犯A最好的策略是認罪。所以我們說「給定B認罪,A的最佳回應是認罪」;同理,「給定B不認罪,A的最佳回應是認罪」。下面我們給出納許均衡的定義。

  納許均衡(Nash Equilibrium;NE):在納許均衡中,所有玩家都在最佳回應彼此

  有點難懂?我們想想看(不認罪、不認罪)是不是納許均衡。給定囚犯A不認罪,囚犯B的最佳回應是什麼呢?是認罪。所以此時囚犯B不是在最佳回應。同理,這個情形下,囚犯A也沒有最佳回應B,因為給定B不認罪,A的最佳回應也是認罪。
  事實上,囚犯困境有唯一的納許均衡:(認罪、認罪)。給定對方認罪,彼此的最佳回應都是認罪。這跟我們的預測一樣,而賽局理論正是預測若人是理性的,結果就是納許均衡
  那麼納許均衡這個概念厲害在哪裡呢?

  納許定理所有非合作賽局(我們談的這種賽局),都有納許均衡*7。

  換句話說,我們不用擔心納許均衡不存在。事實上,在某些情況下我們必須擔心的是納許均衡太多。在賽局理論中很重要的一環,就是修正納許均衡的定義,進而讓預測更合理。

  囚犯困境的結果看起來挺讓人失望,但現實上如何呢?當然(現代)沒有警方會使用這種偵訊手法,但我們同樣可以找人到實驗室模擬這種情境,看看真人的反應為何。實際上,(不認罪、不認罪)的情形還是會出現。這代表什麼?
  1.人是不理性的?
  2.人不只在乎自己?也在乎素昧平生的對方?
  3.怕被報復?
  針對第一點,部分經濟學家和心理學家合作,探討為何賽局理論給出的預測和現實不同,以及為什麼有時人好像不太理性。這樣的學門被稱為「行為賽局理論」(Behavioral Game Theory)。針對第二點,一方面我們可以說幸好還能相信部分人類(而不是人類太可惡),另一方面則是上面給出的數字可能根本不對。
  針對第三點,之所以會怕被報復,是因為日後有可能要重複這個賽局。事實上,針對重複賽局(Repeated Game),就有可能靠著相互報復的威脅在每次賽局時撐住(Support)比雙方都認罪還好的結果。

四、結論
  賽局理論雖是由數學家建立,現今最主要的應用是在個體經濟學領域。其餘如政治學、生物學、資工都有相關應用。在本篇我們看到賽局理論最著名的例子之一:囚犯困境。賽局理論預測這個賽局只有唯一的納許均衡,而到不了對兩人更好的結果,這也是它被稱為困境的原因。
  關於賽局還有太多太多可以跟各位聊的,所以或許可以期待接下來幾次的伍德說數專欄都會聊賽局相關的問題*8。順帶一提,拙作《Math Server》中,帥氣率性的亨利克教授就是以賽局理論作為研究專長喲!
  那麼我是伍德‧瓦懷特,我們下期伍德說數見!


*1.本專欄不開車喔,請大家不要失望(欸)
*2.數字不一定要是1和-1,更嚴格說起來和效用(Utility)有關。科普專欄不談這麼細。
*3.不管怎樣就是要被關啦,誰叫他們是被逮到的現行犯咧?
*4.這裡我們假設兩名囚犯只在意自己被關多久。若是在意對方,表中的數字必須調整,也會變成不同的問題。
*5.兩個人的情況是對稱的,不過個人建議讀者可以自己仿照上面的敘述自己想一遍。
*6.老師,不要急著下音樂,我還沒講完(這個梗算年齡洩漏嗎)
*7.這裡的「都有」必須考慮混合策略(Mixed Strategy),我們下次再談。
*8.而且用到的數學難度比較低,大家應該也比較好接受...吧?
引用網址:https://home.gamer.com.tw/TrackBack.php?sn=4732029
All rights reserved. 版權所有,保留一切權利

相關創作

同標籤作品搜尋:伍德說數

留言共 3 篇留言

函和言
敲碗時間:
數學家的強迫症:求和法到量子重整化

不可預測的未來:混沌理論

到底是不是零?:定義無窮小量

魔術方塊到密碼學:群

03-29 06:31

伍德‧瓦懷特
前面兩個我研究不深(我偏社會科學的,物理真的不行Orz)
無窮的話題會不會太Hardcore了XDD,不過我是有在考慮寫一篇談「希爾伯特的旅館」沒錯。
(現代)密碼學倒是很好的科普話題,雖然有些裡面的梗我想留給Math Server用(欸)。在寫之前,我得把密碼學的筆記給挖出來倒是...03-29 06:45
函和言
你不知道的幾何學:以日本大學生命名的“芳賀定理”

愛因斯坦背後的一群數學家:勞侖茲變換到相對論、矩陣空間和力學、歐基里德空間到閔考斯基時空錐

不得不學的工程數學:傅立葉變換

03-29 06:45

伍德‧瓦懷特
後面兩個太Hardcore了,Hardcore到有一些我沒自信能寫好Orz
Haga(芳賀)定理的話,這種摺紙定理應該要開現場講座比較適合吧XD 03-29 06:51
函和言
無窮是數學家都在用,但物理學家很不喜歡的東西

在無窮上面大作文章吧XD

03-29 06:50

伍德‧瓦懷特
經濟學家也不排斥喔。
等賽局系列寫完後我考慮看看...
在那之前也可以先去看Math Server等待喔(不要趁機打廣告)03-29 06:53
我要留言提醒:您尚未登入,請先登入再留言

12喜歡★e12344888 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:Math Server人... 後一篇:[達人專欄] Math ...

追蹤私訊切換新版閱覽

作品資料夾

pjfl20180818空氣
真糟糕看更多我要大聲說昨天10:35


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】