標籤:
十二碼案例
在一次足球比賽罰十二碼時,罰球隊員可以選擇L,M,R三種不同射門路徑;門將可以選擇撲向左路或者右路(原則上講他也可以守在右路)。
|
l |
r |
L |
4,-4 |
9,-9 |
M |
6,-6 |
6,-6 |
R |
9,-9 |
4,-4 |
該表表示各自的收益,其中,Lr對應的9表示當射手射向左路而門將撲向右路時,射手有90%的機率進球,-9表示門將有90%的機率丟球(10%機率射偏)。其他收益以此類推。我們假設門將撲向右路的機率是Pr,那麼門將撲向左路的機率是Pl=1-Pr。那麼,射手選擇左路的預期收益為 EU1(L,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*4 + Pr*9 = 4 + 5*Pr;選擇中路的預期收益為 EU1(M,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*6 + Pr*6 = 6;選擇右路的預期收益為 EU1(R,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*9 + Pr*4 = 9 - 5*Pr;
結論:從中路射門都不是一個最佳策略;不要選擇在任何信念下都不是最佳策略的策略。
定義:參與者i的對策si是對手的策略s-i的最佳對策,若且唯若對於參與者i的所有其他策略si‘,U1(si,s-i)>=U1(si‘,s-i)
商業合作案例
兩個參與者都是公司的股東,他們都持有公司的股份並且平分利潤。
si表示第i個股東為公司付出的精力。i=1,2。
總收益為4*(s1 + s2 + B*s1*s2)
所以對於每個參與者,他們能夠獲得的收益是1/2*4*(s1 + s2 + B*s1*s2) = 2*(s1 + s2 + B*s1*s2)
我們現在來考慮參與者1,他的付出是s1^2,s所以他的淨收益為:2*(s1 + s2 + B*s1*s2) - s1^2
為了讓收益最大,對s1求導得出收益導數為0的方程:s1 = 1 + B*s2
同理,對於s2,s2 = 1 + B*s1
我們這裡設B=1/4。S=[1,4]。
這裡看一看到,因為s1的範圍只在1和2之間,所以[0,1]和[3,4]是s1的劣勢策略;同理,[0,1]和[3,4]是s2的劣勢策略。所以剔除之後剩下了s1∈[1,2],s2∈[1,2]這個區間,我們將其放大四倍,發現了和原來一樣的圖。然後我們就可以接待進行剔除了。最後得到的點就是方程組:s1 = 1 + B*s2
s2 = 1 + B*s1
的解。得出:s1 = s2 = 1/(B-1)(1/(B-1), 1/(B-1))這個點稱為納什均衡 Nash Equilibrium
這意味著博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處,雙方都採取彼此的最佳對策。
博弈論學習筆記(四)足球比賽與商業合作之最佳對策