標籤:統計學 思維導圖
老習慣,還是先給出該章節的思維導圖讓大家先有個整體的概念
對於基礎概念就不在此贅述,挑其中的幾個容易混淆的點和關鍵點說說
首先便是互斥事件與獨立事件,很多人會將兩者混淆。有個例子很好的說明了兩者不是一回事:
如果兩個事件是互斥事件,其中之一被確定已經發生,則另一事件發生的機率降為0,顯然兩者是相關的。
其次為何要引入條件機率呢? 這是因為現實生活中相互獨立的事件很少,大多數事件的發生都與其他事件有關聯,計算他們發生的機率時我們就需要採用條件機率的方式,當然如果兩個事件是相互獨立的就不必在意該事件的發生是否受其他事件的影響了。
貝葉斯定理是十分重要的一個定理,再次僅作簡單介紹,之後會有博文細說貝葉斯定理。 (也可以看看劉未鵬寫的關於貝葉斯的博文)
很多情況下我們對我們關心的事件可以給出一個先驗機率估計,然後隨著我們的調查研究我們將會得到更多的新資訊,於是我們便可以利用這些新資訊對我們的先驗機率進行糾正得到該事件的後驗機率。貝葉斯定理就是這樣的機率分析手段。
【先驗機率->新資訊->應用貝葉斯定理->後驗機率】
貝葉斯定理廣泛應用於決策分析中。先驗機率通常是由決策者主觀估計的。在進行戰略決策時,會在取得樣本資訊後計算後驗機率以供決策者使用。
-----------------------------------------------------------------------------------------------------------------------------------------------------------
二項實驗的性質
(1) 實驗由一個包括 n次相同的實驗的序列組成。
(2) 每次實驗有兩種可能結果。我們把其中一個稱為成功,另一個稱為失敗。
(3) 成功的機率,用p來表示,各個實驗都相同。於是,失敗的機率用1-p表示,也都相同。 【穩定性假設】
(4) 實驗都是獨立的。 【實驗的獨立性】
-------------------------------------------------------------------------------------------------------------------------------------------------------------
泊松分布是一個十分重要的分布,它主要用於估計某事件在特定的時間段或空間中發生的次數
--------------------------------------------------------------------------------------------------------------------------
泊松實驗的性質
1、在任意兩個相等長度的區間上事件發生一次的機率是相等的
2、事件在某一區間上發生或者不發生與其他區間上事件是否發生是無關的
---------------------------------------------------------------------------------------------------------------------------
泊松分布還有一個比較重要的特性是其期望與方差是相等的。
超幾何分布的期望為n*(r/N),方差為n*(r/N)*(1-r/N)*((N-n)/(N-1)),當N足夠大的時候,記r/N為p,則期望為np,方差為np(1-p),顯然在此情況下,超幾何分布可用二項分布逼近。
連續型隨機變數和離散隨機變數的區別:
1、不再討論隨機變數取某一特定值的機率。代替地,討論隨機變數在某一給定區間取值的機率。
2、隨機變數在從 x1到x2間的某一給定區間取值的機率被定義為機率密度函數在 x1與x2間的圖形的面積。
常態分佈是十分重要的分布
性質:
正態機率分布有一個完整家族。每一特定常態分佈通過其均值 μ 、標準差 σ 來區分。
正態曲線的最高點在均值,它也是分布的中位元和眾數
分布的均值可以是任意數值:負數、零或正數。
正態機率分布是對稱的。
曲線的尾端向兩個方向無限延伸,且理論上永遠不會與橫軸相交。
標準差決定曲線的寬度
正態機率分布曲線下的總面積是 1,對所有的連續型機率分布都是如此。
正態隨機變數的機率由曲線下面積給出。一些常用區間的機率是68.26%,95.44%,99.72%
連續修正因子:當用連續正態機率分布來近似離散二項機率分布時,從x值加減的0. 5值。
指數分布與泊松分布的關係在於,如果泊松分布給出了每一間隔中發生次數的適當描述,則指數分布可給出兩次發生之間間隔長度的描述。
PS: 指數分布是偏度為2的嚴重右偏分布。