【艾拉的視角】
為甚麼會這樣…
他是用了甚麼作弊的手段嗎?
不、不可能這樣的。
在一千回合的戰鬥中,現在是第七百二十三場。
當我和卡爾選擇好策略後,我們後面的牆壁便馬上將結果映射出來。
我選擇的是「進攻」,卡爾選擇的是…「防守」。
而我和卡爾的積分分別是-382分和-337分,也就是說卡爾已經領先我差不多50分了。
剛開始的時候明明是我領先的,但不知道在甚麼時候開始卡爾慢慢追上來了。
他從第一場到現在也是採取「防守」,所以會是一直用「防守」嗎?
不,說不定是在迷惑我,因為全選「防守」聽起來不怎麼合邏輯。
如果卡爾全部都選擇「防守」,那我全部選擇「不做事」就好了嗎?
但是要是卡爾知道我會一直選擇「不做事」,那他不就會知道我一直選擇「不做事」而直接「攻擊」嗎?
為甚麼他能這麼堅定地採取這樣的策略?
***
似乎因為長時間做著重複的行為,我彷彿沉醉在另一個世界一樣。
雖然中間有隔板將我和艾拉隔開,但就算沒看到她我也能想像她苦惱的樣子。
證據就是她已經連續好幾場都是接近耗盡十秒才能選擇策略。
事實上,勝負從一開始已經決定好。
這場比賽是這麼多場中最無聊的。
說最無聊可能有點不恰當,但對我來說就是這樣沒錯,正因為艾拉是會喜歡思考的人,所以我才能容易猜測她的想法。
如果將雙方的收益表寫出來,那就會是這樣:
|
進攻 |
防守 |
不做事 |
進攻 |
-2, -2 |
-2, 2 |
3, -3 |
防守 |
2, -2 |
-1, -1 |
-1, 0 |
不做事 |
-3, 3 |
0, -1 |
0, 0 |
看艾拉七百多場的行動,大概憑直覺地認為這場比賽是考驗策略上的機率分配吧?
事實上,我跟艾拉的選擇都是對稱的,所以基本上可以簡化成只考慮其中一方的得益,也就是:
進攻 |
-2 |
-2 |
3 |
防守 |
2 |
-1 |
-1 |
不做事 |
-3 |
0 |
0 |
這裡先假設對方會有p的機率「進攻」、q的機率「防守」和(1-p-q)的機率「不做事」,會這樣假設是因為只有這三個選擇,所以加起來的機率是1。
那進攻、防守和不做事的期望值就分別是:
進攻:-2p-2q+3(1-p-q)=-2p-2q+3-3p-3q=-5p-5q+3
防守:2p-q-1(1-p-q)=2p-q-1+p+q=3p-1
不做事:-3p
下一個問題是,對方會根據甚麼作出決定呢?那當然是哪邊期望值比較高就會選哪個吧。
換句話說,假如進攻的期望值比較高,就會選進攻。
以數學的表述就是,如果-5p-5q+3 > 3p -1 和-5p-5q+3 > -3p,那對方就會選擇進攻。
然後如果3p-1 > -5p-5q+3 和3p-1 > -3p,那對方就會選擇防守。
最後如果-3p > -5p-5q+3 和-3p > 3p-1,那對方就會選擇不做事。
那麼,到底甚麼時候才會出現「沒有特別優勢」的情況呢?
答案就是,透過改變自己採取策略的機率從而讓對方沒辦法得到任何期望值的甜頭,以數學上來說就是:-5p-5q+3=3p-1=-3p
接下來只需要解開p和q的值便可,也不難解決,可以直接分開寫成:
-5p-5q+3 = -3p 和 3p-1=-3p
後者的答案顯然而見是p=1/6,將p=1/6代進前者可以得出q=8/15
所以,這代表我們得出1/6機率進攻,8/15機率防守和1-1/6-8/15=3/10的機率不做事。
順帶一提,如果用這種方法,那每場得分的期望值就是-5p-5q+3=3p-1=-3p,將上面算的p和q代進去便知道答案是-0.5,而經過一千場的結果便是-500分。
即使沒有進行計算,艾拉憑直覺也得到了和理論值非常相近的答案,她在這方面可說是非常有潛質。
然而,如果雙方都用相同的方法,那就會變成純粹的運氣遊戲而已。
不過,這種想法真的是最佳的方法嗎?
明顯地,上面的方法只能說是合理卻不是最好的,而我所採取的行動明顯地也不是照著上面的方法做。
要說為甚麼,那是因為如果我知道對方會選擇「防守」以外的手段,也就是有差不多一半機率選擇「進攻」和「不做事」,那我全部選擇「防守」自然容易得分。
正因為對手是艾拉,他才會比平常的人想更多,而正因為會想更多所以她才沒料到我會進行這麼單純的操作。
***
【艾拉的視角】
現在已經是第九百九十五場,卡爾一樣在訊號開始的瞬間便決定好。
我抱著半放棄的心態按下了「不做事」,而卡爾選擇的是「防守」。
這樣我就沒有扣分而卡爾則被扣1分。
但是,很遺憾地基本上勝負已分。
我獲得的分數是-871,卡爾獲得的分數則是-431,就算接下來幾場都是我選擇進攻而卡爾選擇不做事,輸的人也會是我。
「這場比賽…是我輸了。」
雖然不想承認,但我還是老實地說出來了。
「看來是這樣沒錯。」
他一副輕描淡寫的態度。
「那你現在可以告訴我為甚麼…你到底是怎麼看穿我的策略。」
不服輸歸不服輸,但正因為知道卡爾在我之上我才想向他學習更多。
結果他跟我說了一堆關於機率的東西,雖然有點複雜但我還是在腦海中思考了一下,確實他說的都有道理。
當然,他這個方法絕對不是必勝,是建基於知道我打算使出甚麼策略的情況下的反擊策略。
舉例來說,假如我連續一千場戰鬥都是「不做事」,那麼我就能獲得更多的分數。
不,就算是想著跟他平手,要我連續一千場都是「防守」也很難,主要是心理上會產生抗拒,因為大家都明白「防守」並不是必勝,但一直使出同樣而不是必勝的策略根本不是正常人能做到。
如果說要怎樣能贏,那就是以「防守」為主策略然後偶爾使出幾次「不做事」吧?
可是如果我真的使出這樣的策略,卡爾也會使出同樣的策略嗎?
不,現在回想起來,他會採取全部「防守」的策略是因為會知道我會想出甚麼策略。
毫無疑問,他每一場都很快選出答案的舉動也是在試探我。
假如我也跟他一樣每一場都很快便能決定,他就知道我也是有著預想好的策略然後對我進行反擊。
相反,只要我有一絲遲疑,那他就會知道我並沒有確實每場戰鬥知道自己想決定甚麼,至少可以確定我不會只選擇同一個策略。
也就是說,卡爾並不只是在遊戲上動腦筋,還控制了整個遊戲的節奏,在遊戲以外的地方誘導我。
這個人是怪物嗎?
***
作者後記:
貴安,MPL的說。關於這個遊戲,老實說寫的時候我都不太肯定怎樣寫比較好,為了驗證自己寫的東西我稍微寫了個程式去驗證,有興趣的可以自己試試看吧,我會將程式碼和連結放在下面。最後,覺得不錯請給個GP、留言,還沒訂閱的就訂閱,這樣就能將我的好感度刷好刷滿。那麼,後會有期。