Khan公開課 – 統計學學習筆記:(三)隨機變數、機率密度、二項分布、期望值

來源:互聯網
上載者:User

隨機變數 Random Variable

隨機變數和一般資料上的變數不一樣,通常用大寫字母表示,如X、Y、Z,不是個參數而是function,即函數。例如,下面表示明天是否下雨的隨機變數X,如下。又例如X=每小時經過路口的車輛,隨機變數是個描述,而不是方程中的變數。

隨機變數有兩種,一種是離散的(discrete),一種是連續的(continue)。離散的如上面例子是可以枚舉,而連續的隨機變數的取值是infinite的。

機率密度函數

機率probability,以roll dice為例,P(X=6)=1/6,P(X>=5)=1/3,即6點的骰子機率為1/6,大於等於5點的骰子機率為1/3。這是離散的機率例子。

對於連續的,例如明天雨量。使用的是probability density function,是個分布例子。

P(X=2)是多少,0.5嗎?不對。精確雨量要2.00000……,機率為0。對於連續隨機變數,機率的統計是一個範圍,例如P(|X-2|<0.3),相當於計算area。以f(x)表示隨機variable,則為

二項分布

二項分布binomial distribution,有個更熟悉的名字normal distribution常態分佈。隨機變數處於兩種狀態,例如硬幣的正面或反面,投籃投中或者miss。如果是公平隨機,例如拋硬幣,每個狀態出現的幾率是0.5。對於投籃,可能是P(shoot)=0.7,P(miss)=0.3。

如何計算P(X=n),n為出現某種狀態的次數。假設一共投籃N次籃(N=6),有多少種可能組合,例如出現2次命中的組合。簡單說我們有A、B兩個字母,填入6個空格,可以有多少種組合。為6×5,如果有A、B、C三個字母,則有6×5×4,即N!/(N-n)!

由於在計算機率中,A和B的先後順序沒有影響,即無先後順序,則還要除以n!(A、B或A、B、C本身的排列組合),在組合中表述為:

我們得到了組合次數,每個組合出現的機率是多少?投6中2為P(shoot)p(shoot)p(miss)p(miss)p(miss)p(miss),將每個位置出現的機率乘前來就可以,即p^n×(1-p)^(N-n),總的機率為:

其實倒不需要去死記硬背,只要知曉計算原理,很容易推導。

這些機率非常適合在Excel中進行計算和畫圖。在Excel有個小技巧我一直不會,如果固定選某個單元,選擇後用F4,在copy這個公式的時候,就不會飄移位置。

期望值E(X)

期望值Exptected value of a random varaible,實際就是population mean,有些時候總本是infinite,例如無數次仍投硬幣的結果,可通過頻率×數值求和獲得。

二項分布的E(X)

如果是二項分布,n表示次數,則E(X)=np,這個推導過程很有趣

二項分布的variance(方差)

和期望值一樣,這屬於頭腦體操,其基本方式亦也差不多。將證明方差為np(1-p)。這部分不是Khan公開課,講常態分佈時涉及二項式方差的計算公式,興緻來了,玩一下。

相關連結:我的四方書庫

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.