標籤:
Ask:
什麼是預測區間,信賴區間和預測區間二者的異同是什嗎?
Answer:
信賴區間估計(confidence interval estimate):利用估計的迴歸方程,對於自變數 x 的一個給定值 x0 ,求出因變數 y 的平均值的估計區間。
預測區間估計(prediction interval estimate):利用估計的迴歸方程,對於自變數 x 的一個給定值 x0 ,求出因變數 y 的一個個別值的估計區間。
----------------------------
轉:http://f.dataguru.cn/thread-47303-1-1.html
第9周作業的最後一題要求給出預測值得區間估計。reg過程中有2個選項CLM和CLI,那麼到底哪一個才是我們需要的呢?
協助文檔描述:
CLI requests the 100(1-α)% upper and lower confidence limits for an individual predicted value. By default, the 95% limits are computed; the ALPHA= option in the PROC REG or MODEL statement can be used to change the α level. The confidence limits reflect variation in the error, as well as variation in the parameter estimates. See the section Predicted and Residual Values and Chapter 4, Introduction to Regression Procedures, for more information.
CLM displays the 100(1-α)% upper and lower confidence limits for the expected value of the dependent variable (mean) for each observation. By default, the 95% limits are computed; the ALPHA= in the PROC REG or MODEL statement can be used to change the α level. This is not a prediction interval (see the CLI option) because it takes into account only the variation in the parameter estimates, not the variation in the error term. See the section Predicted and Residual Values and Chapter 4, Introduction to Regression Procedures, for more information.
我查閱了相關資料,迴歸模型有2種區間估計:
一種是信賴區間(confidence interval),他是對於x的一個給定值,y的平均值的區間估計。
另一種是預測區間(prediction interval),他是對於x的一個給定值,y的一個個別值的區間估計。
從協助文檔看,CLI對應的是預測區間(prediction interval),CLM對應的是信賴區間(confidence interval),並且預測區間的範圍總是要比信賴區間的範圍要大的。就是說,給定一個X,估計對應Y的平均值平均值比估計一個個別值更精確一點。其實也好理解,估計平均值比估計個別值貌似更簡單一點嘛。個別值更容易受一些外界因素影響而有差異性,而平均值則相對穩定些。
以作業為例,當根據樣本建立了迴歸方程後,假設需要預測以下2個問題:
1. 今年最大積雪深度為7米,預測今年灌溉面積
2. 對於那些積雪深度為7米的年份,預測灌溉面積
第一個問題就是一個預測個別值的例子,而第2個問題就是預測一個平均值的例子。
什麼是預測區間,信賴區間與預測區間二者的異同是什嗎?