博弈論學習筆記（四）足球比賽與商業合作之最佳對策

最後更新：2015-03-15 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

標籤：

十二碼案例

在一次足球比賽罰十二碼時，罰球隊員可以選擇L,M,R三種不同射門路徑；門將可以選擇撲向左路或者右路（原則上講他也可以守在右路）。

	l	r
L	4,-4	9,-9
M	6,-6	6,-6
R	9,-9	4,-4

該表表示各自的收益，其中，Lr對應的9表示當射手射向左路而門將撲向右路時，射手有90%的機率進球，-9表示門將有90%的機率丟球（10%機率射偏）。其他收益以此類推。我們假設門將撲向右路的機率是Pr，那麼門將撲向左路的機率是Pl=1-Pr。那麼，射手選擇左路的預期收益為 EU1(L,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*4 + Pr*9 = 4 + 5*Pr;選擇中路的預期收益為 EU1(M,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*6 + Pr*6 = 6;選擇右路的預期收益為 EU1(R,Pr) = Pl*U1(L,l) + Pr*U1(L,l) = (1-Pr)*9 + Pr*4 = 9 - 5*Pr;


結論：從中路射門都不是一個最佳策略；不要選擇在任何信念下都不是最佳策略的策略。

定義：參與者i的對策si是對手的策略s-i的最佳對策，若且唯若對於參與者i的所有其他策略si‘，U1(si,s-i)>=U1(si‘,s-i)

商業合作案例

兩個參與者都是公司的股東，他們都持有公司的股份並且平分利潤。
si表示第i個股東為公司付出的精力。i=1,2。
總收益為4*(s1 + s2 + B*s1*s2)
所以對於每個參與者，他們能夠獲得的收益是1/2*4*(s1 + s2 + B*s1*s2) = 2*(s1 + s2 + B*s1*s2)
我們現在來考慮參與者1，他的付出是s1^2，s所以他的淨收益為：2*(s1 + s2 + B*s1*s2) - s1^2
為了讓收益最大，對s1求導得出收益導數為0的方程：s1 = 1 + B*s2
同理，對於s2，s2 = 1 + B*s1
我們這裡設B=1/4。S=[1,4]。

這裡看一看到，因為s1的範圍只在1和2之間，所以[0,1]和[3,4]是s1的劣勢策略；同理，[0,1]和[3,4]是s2的劣勢策略。所以剔除之後剩下了s1∈[1,2]，s2∈[1,2]這個區間，我們將其放大四倍，發現了和原來一樣的圖。然後我們就可以接待進行剔除了。最後得到的點就是方程組：s1 = 1 + B*s2
s2 = 1 + B*s1
的解。得出：s1 = s2 = 1/(B-1)(1/(B-1), 1/(B-1))這個點稱為納什均衡 Nash Equilibrium

這意味著博弈雙方彼此都不想偏離納什均衡點。在納什均衡點處，雙方都採取彼此的最佳對策。

博弈論學習筆記（四）足球比賽與商業合作之最佳對策

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

博弈論學習筆記（四）足球比賽與商業合作之最佳對策

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support