隨機變數 Random Variable
隨機變數和一般資料上的變數不一樣,通常用大寫字母表示,如X、Y、Z,不是個參數而是function,即函數。例如,下面表示明天是否下雨的隨機變數X,如下。又例如X=每小時經過路口的車輛,隨機變數是個描述,而不是方程中的變數。
隨機變數有兩種,一種是離散的(discrete),一種是連續的(continue)。離散的如上面例子是可以枚舉,而連續的隨機變數的取值是infinite的。
機率密度函數
機率probability,以roll dice為例,P(X=6)=1/6,P(X>=5)=1/3,即6點的骰子機率為1/6,大於等於5點的骰子機率為1/3。這是離散的機率例子。
對於連續的,例如明天雨量。使用的是probability density function,是個分布例子。
P(X=2)是多少,0.5嗎?不對。精確雨量要2.00000……,機率為0。對於連續隨機變數,機率的統計是一個範圍,例如P(|X-2|<0.3),相當於計算area。以f(x)表示隨機variable,則為
二項分布
二項分布binomial distribution,有個更熟悉的名字normal distribution常態分佈。隨機變數處於兩種狀態,例如硬幣的正面或反面,投籃投中或者miss。如果是公平隨機,例如拋硬幣,每個狀態出現的幾率是0.5。對於投籃,可能是P(shoot)=0.7,P(miss)=0.3。
如何計算P(X=n),n為出現某種狀態的次數。假設一共投籃N次籃(N=6),有多少種可能組合,例如出現2次命中的組合。簡單說我們有A、B兩個字母,填入6個空格,可以有多少種組合。為6×5,如果有A、B、C三個字母,則有6×5×4,即N!/(N-n)!
由於在計算機率中,A和B的先後順序沒有影響,即無先後順序,則還要除以n!(A、B或A、B、C本身的排列組合),在組合中表述為:
我們得到了組合次數,每個組合出現的機率是多少?投6中2為P(shoot)p(shoot)p(miss)p(miss)p(miss)p(miss),將每個位置出現的機率乘前來就可以,即p^n×(1-p)^(N-n),總的機率為:
其實倒不需要去死記硬背,只要知曉計算原理,很容易推導。
這些機率非常適合在Excel中進行計算和畫圖。在Excel有個小技巧我一直不會,如果固定選某個單元,選擇後用F4,在copy這個公式的時候,就不會飄移位置。
期望值E(X)
期望值Exptected value of a random varaible,實際就是population mean,有些時候總本是infinite,例如無數次仍投硬幣的結果,可通過頻率×數值求和獲得。
二項分布的E(X)
如果是二項分布,n表示次數,則E(X)=np,這個推導過程很有趣
二項分布的variance(方差)
和期望值一樣,這屬於頭腦體操,其基本方式亦也差不多。將證明方差為np(1-p)。這部分不是Khan公開課,講常態分佈時涉及二項式方差的計算公式,興緻來了,玩一下。
相關連結:我的四方書庫