創作內容

29 GP

[達人專欄] 【霜の雜談】理科太太錯的在哪? 談賽局理論影片中我認為的錯誤

作者:冰雪 霜華│2019-01-22 10:44:26│巴幣:156│人氣:4483


        昨晚在翻新聞找點笑話來看時,意外看到一篇有關理科太太的新聞。
        我對她是沒多少興趣的,但那篇是有關於農糧署相關的,這我就有些興趣,點開來後看到有關理科太太影片中的偏誤,google之後發現不少文章。

        不管如何,其中提到了賽局理論,那時我差不多準備睡覺了,所以到早上看完後,覺得挺有意思的,於是便有的這篇文。


==============================================
【賽局理論(博弈論)_起源】

        賽局理論這個詞的起源是源自1944年的《Theory of Games and Economic Behavior》,在影片中,理科太太提出了1930年,當時比較像是散性的研究,並沒有統合為賽局理論。

        準確的說,賽局理論相關的內容在1944年提出後,在1950年代廣泛發展,在這之前並沒有相關的系統性建構出來。

        如果要追溯,以可以定位,也就是有文字紀錄的應該是在1713年的一封書信中,可能會有人說書信算什麼文字紀錄,但其實很多影響世界各界的學術理論最初就是在兩個人之間的書信中被提出的,而這也是後面的沃爾德格雷夫問題(Waldegrave problem)。

        1913年的《anber eine Anwendung der Mengenlehre auf die Theorie des Schachspiels》則是博弈論理論化的概念出來的時候,裡面提到的是國際象棋,有趣的是國際象棋是非零和遊戲,1867年就因為這發生過有趣的事情。(比賽中發生了和局過多的情況,原本和局是要重賽,所以就發生讓裁判無言的情況)



        所以要追溯一開始,直白點說怎樣都不會是1930年,實際被應用也是1838年,我就不提她的資料來源了,另外也不太算是零和遊戲。

        理科太太舉例的蛋糕,應該是零和遊戲的例子Fair cake-cutting,這裡說的大致沒有問題,不是完全是因為切蛋糕問題……說實話零和遊戲有很多的例子,切蛋糕問題不單單是「零和遊戲」這麼簡單可以概括的。(應該說是國際問題的層級了)


【理論】

        博弈論到底是用來幹嘛的,準確來說應該是幫助模擬人之間的行為模式,所以才有了許多如囚徒困境之類的例子出來。

        定義之類的東西大方向不變的情況下,很容易出現不同種說法,所以這裡就點到為止,讓我們繼續下去。


納什均衡(Nash equilibrium)
        理科太太提到的dominant strategy,中文翻譯為優勢策略,意思是無論對方做了什麼,我的策略就是好棒棒,其它策略得來的效益沒有這個策略高。 (反過來就是dominated strategy,也就是劣勢策略)

        只是那個無論如何都不會走到最慘的狀況,這個後話有些多餘。


        接下來就是納什均衡,這裡我就開始不知道該說什麼,尤其是聽到她用左右駕舉例。

        納什均衡是說如果博弈的參加者的策略都是為了達大最大期望值,那所有人都會做同樣的策略。

        為何說左右駕這策略讓我有些無言,說認真的你就算是賽車競賽都不會有這問題好嗎,左右駕駛根本不是博弈,還是你是在和空氣競賽啊。

        回歸主題,納什均衡那邊到底出了什麼問題,理科太太所說的囚徒困境發生了什麼?

        我們先說說囚徒困境吧。(如果沒聽過的可以看一下,聽過的就當再聽一次吧)(咦?)

        今天假設兩個囚犯並沒有套招,兩個人關在訊息無法傳遞的狀態,也就是完全信息靜止博弈的情況。

        和兩位囚犯說一樣的話:如果你招了,當汙點證人,我們可以讓你當庭釋放;如果你不招,你的夥伴招了,你要加重刑責到十年;如果你倆都招了,我們以原先的法律判兩年;如果你倆都堅決不招,那就關半年。

        你的想法應該是這樣:如果招了,我有可能當庭釋放,最慘也是兩年;如果我不招,最好是半年,但有可能因為另一個人的背叛而被關十年。

        如果我被背叛了,我至少也要拖個墊背的,招了獲得更低的刑期,如果我沒有被背叛,我背叛了我就可以當庭釋放了。

        所以管它的期望值,是你你背不背叛,背叛啊,結果兩人都招了,關兩年,爽到的只有法官而已。

        但接下來不知道是不是那麼急著要放閃,囚徒困境真的無解?

        囚徒困境的無解適用於只有進行一次博弈的情況,如果是無限囚徒困境就會發生不同的結果,因為最終會在無限的懲罰與合作中達到「合作」的這個結果,這用期望值是算不出來的。

        我不建議用期望值來算,是因為用經濟學的角度來看更好,如果兩邊的合作是最佳解,在多次循環之下一定是選擇合作,不然會一直都是雙方背叛的次解這個結果。

        囚徒困境的結論的確是「帕累托最優」和單次進行的納什均衡互相衝突,但要有多次試驗才能讓其趨近於帕累托最優解這句會比較好。

        另一個錯的地方是用「動態賽局」套在「靜態賽局」,理科太太後面說用的是動態賽局,但納什均衡是靜態賽局。

        為何是靜態賽局,靜態賽局是兩邊同時動作,或是雖然非同時動作,但我不知道另一位做出什麼決定,這個是靜態賽局。

        還記得我前面說過,囚徒困境是「完全信息靜止博弈」嗎,換言之以囚徒困境來看待賽局理論的話,怎樣都不會是動態賽局的。

        我記得之前那篇列出五篇的提出了子博弈完美,這是完全信息動態博弈,又翻為子博弈精煉納什均衡(subgame perfect Nash equilibrium),子博弈的意思是人在任何時間、地點的決定皆是最好的,而所有子博弈所構築而成的就是子博弈精煉納什均衡。

        這是將原本的納什均衡導入了動態的概念,將完全信息靜態博弈的理想狀態更加的實際化,如果有限重複賽局中出現了多個納什均衡,那子博弈精煉納什均衡就成立了。

       如果是這樣那的確可以解釋後來所舉的賽局理論,不過前面與其提囚徒困境,應該提的是蜈蚣遊戲,至少用井字遊戲啊。(兩個的理論依據完全不同)

        有沒有覺得賽局很複雜?
        超複雜的其實,賽局光是動靜態和訊息是否完全就可以分為四種了,而這四種又有各自對應的理論,再由這些理論發展一套系統,這些統合才是賽局理論。

        賽局也可以是很生活化的,只是我們不知道我們在進行賽局而已,就像經濟學是很生活的,其實也沒有想像中的複雜。



        這些理科太太真的不知道嗎,有趣的是她應該是知道的,因為她後面也有提到重複賽局。

        換言之就是內容沒校正而已,囚徒困境一般是以單次賽局為基礎來做舉例,如果討論的深點應該是可以多提這一點的。


【結論】

        這可能會是我做過最長的結論。
        還記得我常提的,我在之前做過的小科普系列吧,我在小科普系列前都會說這並非我的本科,如有偏誤或想要補充的非常歡迎。

        這不太算是敷衍,事實上我的確不是這方面的專業,我也不是三類組的,所以我對資訊的敏感度不高,這也使我在資料搜尋上有些綁手綁腳。

        賽局理論的確非理科的專業,而且憑良心說真的要提賽局,我可以直接出一個新的系列來和各位討論,因為賽局理論的策略問題很多,已經是一個系統性建構的理論了。

        其它我先不論(其實農糧署那個我也可以談,因為我有碰過一些這方面的資訊,但我未必可以說得的完整),賽局這篇很明顯的就是前後落差太大。

        應該說理科太太讀得太淺,以我愛用的蘋果當例子,理科太太提的就像是蘋果的果蠟,也就是稍微摸過一點,知道的概念,但沒有太深論所以出現誤差。

        舉例來說,中段提到的囚徒困境,先不管和後面的相不相符,結論只是初步的結論,所以才會被一句如果是重複賽局就會被打臉了,而且說實話囚徒困境並不符合現實,所以如果說後面是用囚徒困境也說不過去。
(當初囚徒困境被提出時本來就是在一個假定的情況演示的,並不是實際實驗)

        而如果要兼顧後面大力的例子,哪怕OOXX的井字遊戲都比較好,討論深度也不比囚徒困境低,囚徒困境的確是賽局理論的經典例子,但以整個賽局理論中只是四個常見分類的其中一類罷了。

        至於前面的歷史那些我就不多說了,我大概猜的到她的資料來源是哪來的,我只能說再往下多讀一點就知道了,不要小看這點,因為知識的歷史發展往往關係到那個年代與時空背景。



        知識型YTer常常會被人們尊敬一些,但說真的,偶爾也會看到有些被稱為知識型的真的讓我覺得有些無言,這點理科太太還算好的。

        我之前偶然下有看過一位定位上像是知識型YTer的,內容也是讓我直搖頭,但也是有不少人捧他,搖頭的原因無它,一是把很淺的東西說得太深,二是有些內容錯誤百出。

        我不認為知識型的就不能犯錯,強如阿滴英文也犯過錯,今年年初也有發澄清影片。

        但錯了就糾正就好,只能說看這波理科太太是否會出來澄清。

        另外有關為何理科太太這波會有點小鬧,無疑是樹大招風吧,和她是不是女生我認為無關,說認真的,前面一連串的內容,幾分鐘就出現這些錯誤其實真的不容易。

        也就是不夠「嚴謹」,同樣是理科系出身,啾啾鞋的影片嚴謹度就高很多,也就是引經據典,當然相對的如果引用有誤也很容易知道錯在哪。

        我在這之前不怎麼看她的影片,因為這樣的風格真的不是我喜歡的風格,我也不是沒有試著挑戰過啾啾鞋,但說認真的以我的腦袋真的很難反駁他。

        也許她今年會突破到百萬訂閱,也許她不管這波的新聞,她也沒多少損失,因為我沒訂閱她,她從我這賺到的錢連打一通公共電話都不夠。

        只是希望可以有些查閱資料的習慣,不要別人說什麼就是什麼,當然這樣很累,但吸收的資訊才完整。

        我們資料取得的方便程度比以前高很多了,識字率也來到了98%,應該要有足夠的判別能力才是。


        另外我不認為因為理科太太是女的,她才會被攻擊,連我阿嬤都知道有機農藥那部影片錯很大,而理科太太又以知識型YTer自居,成長速度又超快,我認為這些才是因素。

        這些和她是不是女生無關,我看過不少知識型YTer的影片,說認真的出現這麼矛盾的影片我應該是第一次看到,而理科太太又碰得太廣,非專業的地方真的要小心再小心。


        以上是我的個人看法,另外賽局理論那邊如果有說的不對,認為「冰雪你自己也寫錯,應該是@%$^&」,或是「我認為你說得太少,應該還有&*^%$#@」的歡迎在下面補充,我要繼續補我之前的坑了。


引用網址:https://home.gamer.com.tw/TrackBack.php?sn=4268959
All rights reserved. 版權所有,保留一切權利

相關創作

留言共 13 篇留言

睦月 雪芽
精彩…但好像也沒講很深…

01-22 11:34

冰雪 霜華
因為我主要不是要談賽局理論,只是根據她的影片中,我認為有點錯誤的地方提出我的看法。01-22 12:36
貝果
和很多人討論事情都會偏掉
像理科太太明明很多人指出了他的錯誤
但有些人就要歸結到仇女仇男上而不願意正視錯誤

01-22 11:34

冰雪 霜華
其實我認為男的也會發生一樣的狀況,只是性別在現在的時代還是無解。01-22 12:37
白皓
解釋就是要讓人聽得懂
是希望要講到你都聽不懂才叫講很深?

01-22 11:42

冰雪 霜華
與其說要深,不如說是多說一點,說完整一點,例如囚徒困境與其說是和帕累托最優有衝突,不如說是單次囚徒困境,因為只要到重複賽局理論或是無限賽局,這理論就支撐不太住了。01-22 12:39
吃魚-消夜模式❤
知識型YTer只服啾啾鞋 雖然沒看過理科太太的影片
反觀某個仙人掌 唉...不說了

01-22 12:11

冰雪 霜華
啾啾鞋我在很久以前就在追了,以理科相關綜合資訊我的確比較信服他。01-22 12:49
威廉
優勢策略的定義不包含迴避最差狀況的可能性,只是剛好在囚徒困境中,無論對方是否背叛,我方選擇背叛都會得到更優解,剛好迴避掉最差的結局。

左右駕是否統一,對安全性的影響使否存在我沒細究過,所以只是駕駛習慣和生產規格的問題嗎?

靜態賽局的關鍵應該不是訊息不對稱,而是訊息不流通;把大力和理科太太視為先後加入動態賽局的玩家,後手者可以觀察先手者的決策之後做決定,應該是沒有問題的。

01-22 12:19

冰雪 霜華
會說左右駕的關係是因為那大多是國情關係,和賽局無關,例如手扶梯是右上左下還是左上右下也是一樣的道理。
有關後面,我認為有點問題的是我認為應該偏向不完全信息動態博弈,訊息是有流通的且知道先者有做什麼具體動作,但套用的就是完美貝葉斯納什均衡,而她用的模型又和其有點落差。
納什均衡套用的的確是完全信息靜態博弈,而如果是用完全訊息動態博弈則是用子博弈完美納什均衡,這也是井字遊戲的理論依據。
那邊我看可以怎麼說好了,我再調整一下。01-22 12:49
NICEBODY
我當時看了理科太太的影片完後
這跟賽局理論有什麼關係
然而我已經看玩影片了
理科太太贏了

01-22 13:28

冰雪 霜華
某方面來說,以當下利益來看這句挺中肯的。01-22 16:13
ㄔㄐㄐㄔ
知識(?)型我只服狠愛演(x

01-22 13:45

海豹啦
卡蒂亞很正

01-22 13:57

冰雪 霜華
卡蒂亞2.0的覺醒圖是我喜歡的幾張覺醒圖之一。01-22 16:14
紫月海
簡單說

當你是有名網紅時 說錯話 就被放大

如果 沒啥名氣 你說的再正確 沒人想看



01-22 14:08

冰雪 霜華
我認為這是相對的,就像一個詞叫人言微輕吧,相反人重你可能就多少會聽一點,這在邏輯學相關的偏誤中也有類似的詞。01-22 16:16
LOVe高橋李依
每天的賽侷都是很有趣的

01-22 14:40

清野凜太婆我受不了啦
卡個 睡醒看

01-22 14:49

Mask
糾糾鞋我原本偶爾看覺得還不錯,自有一次講網路上傳下載之後就不太看了,單純那次他講的可以算半錯,那次又是種花電信的業配,導致我有點覺得他為了廣告隨便講的感覺…

01-22 14:52

冰雪 霜華
個人的選擇吧,啾啾鞋我也不是每部都很喜歡,但以總體來說不討厭那樣的風格。
喜歡於否這個我認為自己的想法最重要,我尊重。owo)01-22 16:13
威廉
後來又看了一次影片注意到兩車對撞的動畫,我想她說的左右駕應該不只是駕駛在車內的位置,更重要的是在道路上的位置,選擇在不同側行車意味著「逆向駕駛」,如此一來對行車安全的影響便顯而易見了。

賽局理論中的各種模型很多都不是真正的賽局,賽局的名稱只是個具體的比喻。我們只需要設定一些明確的目標用以衡量選擇的策略是否能夠達到利益最大化,如同囚徒困境中,刑期越短我們視作更高的利益;左右駕的選擇,事故率越低,駕駛人活得越長,我認為可以視為該模型的目標。

01-22 15:04

冰雪 霜華
我還是覺得那個舉例有點不好,不過我認同你所說的。01-22 16:11
我要留言提醒:您尚未登入,請先登入再留言

29喜歡★MingYue52184 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:[達人專欄] 【霜の雜談... 後一篇:[達人專欄] 【霜談動畫...

追蹤私訊切換新版閱覽

作品資料夾

leon770530巴友
我的小屋首頁共有四篇健身相關證照心得文,對健身有興趣的朋友可以來看看喔!看更多我要大聲說12小時前


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】