日韩精品 中文字幕 动漫,91亚洲午夜一区,在线不卡日本v一区v二区丶,久久九九国产精品自在现拍

正文

從囚徒困境說嚴格優(yōu)勢策略均衡

博弈論平話 作者:王則柯


回到上一節(jié)開始討論的嫌疑犯博弈問題。如果兩個嫌疑犯都是只為自己利益打算的所謂理性主體人(rational agent),兩位犯罪嫌疑人博弈可能的結果會怎樣呢?要是乙抵賴,那么,如果甲坦白甲就可以得到寬大釋放;要是乙坦白,那么,如果甲也坦白的話甲要坐三年牢,但是如果甲抵賴的話甲可要坐五年牢。可見對于甲來說,不管乙采取什么策略,他坦白自己總是比較有利的。所以兩相比較,坦白是他的全面的嚴格的優(yōu)勢策略。

全面,指的是不論對方采取哪個策略,我的這個策略總顯示優(yōu)勢:對方坦白,我坦白比抵賴好;對方抵賴,我也是坦白比抵賴好。嚴格,指的是這個優(yōu)勢策略的結局確實要好一些:對方坦白,我坦白得–3確實比抵賴得–5好;對方抵賴,我坦白得0也確實比抵賴得–1好。這里,嚴格是說:–3不僅僅是不差于–5,而且是嚴格好于–5;0不僅僅是不差于–1,而且是嚴格好于–1?!叭娴膰栏竦膬?yōu)勢策略”說起來拗口,我們約定以后可以就簡稱為嚴格優(yōu)勢策略(strictly dominant strategy)。優(yōu)勢劣勢是比較而言的。在這個博弈中,既然坦白是嚴格優(yōu)勢策略,那么抵賴就是相應的嚴格劣勢策略(strictly dominated strategy)。

同樣道理,坦白也是犯罪嫌疑人乙的全面的嚴格的優(yōu)勢策略,抵賴是相應的嚴格劣勢策略。

理性的主體人是不會采用對自己明顯不利的嚴格劣勢策略的,所以在分析博弈可能的結局的時候,我們應該把局中人的嚴格劣勢策略刪去。下面圖中一橫一豎的兩條粗實線,就代表兩個參與人各自把自己的嚴格劣勢策略刪去。在這個博弈中把雙方的嚴格劣勢策略都刪去以后,我們就得到這樣的結論:博弈的結局是雙方都選擇“坦白”策略,在雙方博弈的這個對局之下,他們各得支付–3。

經濟學習慣把市場力量對峙的穩(wěn)定結局,叫做市場均衡(equilibrium)。比方說電視機的市場,供不應求將驅使價格上升,供大于求將迫使價格下降,供求力量對峙的結果,會在某個價格水平達到市場供求的均衡。但是像上面這樣用刪去劣勢策略的方法得到的由雙方的嚴格優(yōu)勢策略組成的對局,作為這個博弈的均衡,叫做嚴格優(yōu)勢策略均衡(equilibrium of strictly dominant strategies)。

這個博弈有一個一直沿用的專門名稱,叫做囚徒困境(Prisoner’s Dilemma),所謂囚徒就是上面講的嫌疑犯。在囚徒困境兩行兩列的矩陣格式中,下面一行對應的是甲的嚴格劣勢策略,右面一列對應的是乙的嚴格劣勢策略,把它們都刪去,就得到“坦白,坦白”得“–3,–3”這個嚴格優(yōu)勢策略均衡。注意,在“–3,–3”或者(–3,–3)這樣的寫法中,第一個數(shù)字是甲之所得,第二個數(shù)字是乙之所得??傊?,面對上述形式的博弈表達,在(–3,–3)這樣的寫法中,第一個數(shù)字是表格左方博弈參與人之所得,第二個數(shù)字是表格上方博弈參與人之所得。

為節(jié)約篇幅,今后有時候將只在“矩陣表格”里用黑體字把結果的位置表示出來。注意,這里講的嚴格優(yōu)勢策略,是全面的嚴格的優(yōu)勢策略:不論對方采取什么策略,我采取這個策略總比采取任何別的策略都好,而且要確實顯出好來,不許“打平手”。被全面的嚴格的優(yōu)勢策略壓住的那個策略,才叫做嚴格劣勢策略。像上面那樣通過把嚴格劣勢策略刪去的方法尋求對局結果的方法,叫做嚴格劣勢策略消去法。如果甲乙都有三四個甚至更多的策略選擇,通常需要一次一次又一次把嚴格劣勢策略刪去,才能最后得到一個均衡。這樣一次一次把嚴格劣勢策略刪去以尋求對局結果的方法,叫做嚴格劣勢策略逐次消去法(iterated elimination of strictly dominated strategies)。


上一章目錄下一章

Copyright ? 讀書網(wǎng) rgspecialties.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號