標籤:
轉載
一直做著的不確定性分析,很多時候會涉及到信賴區間的概念,但一直沒能有個清晰的認識,今天終於從網上查資料,具體核實了信賴區間的含義。
95%信賴區間(Confidence Interval,CI):當給出某個估計值的95%信賴區間為【a,b】時,可以理解為我們有95%的信心(Confidence)可以說樣本的平均值介於a到b之間,而發生錯誤的機率為5%。
有時也會說90%,99%的信賴區間,具體含義可參考95%信賴區間。
信賴區間具體計算方式為:
(1)知道樣本均值(M)和標準差(ST)時:
信賴區間下限:a=M - n*ST; 信賴區間上限:a=M + n*ST;
當求取90% 信賴區間時 n=1.645
當求取95% 信賴區間時 n=1.96
當求取99% 信賴區間時 n=2.576
(2)通過利用蒙特卡洛(Monte Carlo)方法獲得估計值分布時:
先對所有估計值樣本進行排序, 信賴區間下限:a為排序後第lower%百分位值; 信賴區間上限:b為排序後第upper%百分位值.
當求取90% 信賴區間時 lower=5 upper=95;
當求取95% 信賴區間時 lower=2.5 upper=97.5
當求取99% 信賴區間時 lower=0.5 upper=99.5
當樣本足夠大時,(1)和(2)擷取的結果基本相等。
參考資料:http://140.116.72.80/~smallko/ns2/confidence_interval.htm
附剛準備MATLAB 求取信賴區間源碼:
……………………………………………………………………………………………………………………
%%% 信賴區間的定義90%,95%,99%
clear
clc
sampledata=randn(10000,1);
a=0.01; %0.01 對應99%信賴區間, 0.05 對應95%信賴區間 ,0.1 對應90%信賴區間
if a==0.01
n=2.576; % 2.576 對應99%信賴區間, 1.96 對應95%信賴區間 ,1.645 對應90%信賴區間
elseif a==0.05
n=1.96;
elseif a==0.1
n=1.645;
end
%計算對應百分位值
meana=mean(sampledata);
stda=std(sampledata);
sorta=sort(sampledata); %對資料從小到大排序
leng=size(sampledata,1);
CIa(1:2,1)=[sorta(leng*a/2);sorta(leng*(1-a/2))];
%利用公式計算信賴區間
CIf(1:2,1)=[meana-n*stda;meana+n*stda];
信賴區間(Confidence Interval)