博弈論學習筆記(四)足球比賽與商業合作之最佳對策

來源:互聯網
上載者:User

標籤:

十二碼案例

在一次足球比賽罰十二碼時,罰球隊員可以選擇L,M,R三種不同射門路徑;門將可以選擇撲向左路或者右路(原則上講他也可以守在右路)。

  l r
L 4,-4 9,-9
M 6,-6 6,-6
R 9,-9 4,-4
該表表示各自的收益,其中,Lr對應的9表示當射手射向左路而門將撲向右路時,射手有90%的機率進球,-9表示門將有90%的機率丟球(10%機率射偏)。其他收益以此類推。我們假設門將撲向右路的機率是Pr,那麼門將撲向左路的機率是Pl=1-Pr。那麼,射手選擇左路的預期收益為 EU1(L,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*4 + Pr*9 = 4 + 5*Pr;選擇中路的預期收益為 EU1(M,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*6 + Pr*6 = 6;選擇右路的預期收益為 EU1(R,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*9 + Pr*4 = 9 - 5*Pr;


結論:從中路射門都不是一個最佳策略;不要選擇在任何信念下都不是最佳策略的策略。

定義:參與者i的對策si是對手的策略s-i的最佳對策,若且唯若對於參與者i的所有其他策略si‘,U1(si,s-i)>=U1(si‘,s-i)

商業合作案例

兩個參與者都是公司的股東,他們都持有公司的股份並且平分利潤。
si表示第i個股東為公司付出的精力。i=1,2。
總收益為4*(s1 + s2 + B*s1*s2)
所以對於每個參與者,他們能夠獲得的收益是1/2*4*(s1 + s2 + B*s1*s2) = 2*(s1 + s2 + B*s1*s2)
我們現在來考慮參與者1,他的付出是s1^2,s所以他的淨收益為:2*(s1 + s2 + B*s1*s2) - s1^2
為了讓收益最大,對s1求導得出收益導數為0的方程:s1 = 1 + B*s2
同理,對於s2,s2 = 1 + B*s1
我們這裡設B=1/4。S=[1,4]。

這裡看一看到,因為s1的範圍只在1和2之間,所以[0,1]和[3,4]是s1的劣勢策略;同理,[0,1]和[3,4]是s2的劣勢策略。所以剔除之後剩下了s1∈[1,2],s2∈[1,2]這個區間,我們將其放大四倍,發現了和原來一樣的圖。然後我們就可以接待進行剔除了。最後得到的點就是方程組:s1 = 1 + B*s2
s2 = 1 + B*s1
的解。得出:s1 = s2 = 1/(B-1)(1/(B-1), 1/(B-1))這個點稱為納什均衡 Nash Equilibrium

這意味著博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處,雙方都採取彼此的最佳對策。

博弈論學習筆記(四)足球比賽與商業合作之最佳對策

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.