置信水平和置信區間是AP考試中每年必定會(hui) 考查的考點,也是經常讓同學們(men) 很頭疼的問題。做題的時候,經常會(hui) 碰到題目中給出95% confidence interval這樣的表述,這裏的confidence level 95%究竟是什麽(me) 含義(yi) 呢?比如下麵的題目:
題目的答案是E,大家可以把自己的思考過程記下來,後麵會(hui) 給出解析。
我們(men) 先一起回顧“統計推斷”的定義(yi) :統計推斷是根據樣本數據對總體(ti) 進行推斷的過程,回答類似“在職人士中有本科及以上學曆的占多少百分比?”,“全國一年級小學生的平均身高是多少?”等問題。
這類問題的共同點是尋找用來描述總體(ti) 的一個(ge) 數字化測量(numerical measure),通常是總體(ti) 比例或者總體(ti) 均值,稱為(wei) 參數(parameter)。參數是總體(ti) 中所有個(ge) 體(ti) 的一個(ge) 聯合測量值,在尋找參數的過程中,我們(men) 會(hui) 麵臨(lin) 以下兩(liang) 種情形。
第一種情形:如果我們(men) 能夠找到總體(ti) 中每一個(ge) 測量值,就可以準確計算出參數的大小,無需采用估計的方法獲得參數的取值範圍。以下麵的題目為(wei) 例:
大家要特別關(guan) 注題幹中陳述的which included all of the American Presidents and all of the British Prime Ministers,這句話代表可以拿到總體(ti) 中每個(ge) 個(ge) 體(ti) 的取值,直接計算參數即可完成比較,不再需要搜集樣本並用樣本統計量估計參數的過程,答案選B。
第二種情形:現實中我們(men) 遇到的大多數問題,很難找到總體(ti) 中每一個(ge) 個(ge) 體(ti) 的取值,隻能通過搜集樣本的方式計算出樣本統計量,進而用統計量的值去估計總體(ti) 參數值。這裏大家要有一個(ge) 最基礎的認識,雖然此類情形下總體(ti) 參數值未知,但它仍是一個(ge) 固定值(fixed value),隻是因為(wei) 我們(men) 無法找到總體(ti) 中每個(ge) 個(ge) 體(ti) 的取值,所以我們(men) 無法得知其具體(ti) 大小。
參數估計是概率統計學中的核心問題,我們(men) 可以用點估計(point estimator)估計總體(ti) 參數的樣本統計量,但不能期望點估計量能給出總體(ti) 參數的精確值,因此需要在點估計基礎上加減邊際誤差(margin of error)來計算區間估計。
大家熟悉的參數置信區間(confidence interval)的形式是:點估計值(point estimator)±邊際誤差(margin of error),置信水平(confidence level)是不斷重複抽樣時,構建的多個(ge) 區間中能捕捉到總體(ti) 參數的概率(這裏要重點理解95%置信水平是指“構建多個(ge) 區間中,包含總體(ti) 參數值的區間個(ge) 數占比為(wei) 95%”)。
接下來,為(wei) 大家梳理一下做置信水平和置信區間問題的判別標準。
第一,參數的置信區間為(wei) :點估計值(point estimate)±邊際誤差(margin of error)。所以我們(men) 可以理解邊際誤差(margin of error)為(wei) 估算的點估計值與(yu) 總體(ti) 參數值之間的大致差異。
第二,置信水平和置信區間的最本質的含義(yi) 就是:從(cong) 同一個(ge) 總體(ti) 重複抽樣(樣本量一致),會(hui) 根據所抽到的樣本得到不一樣的95%置信區間,但是這些區間中,會(hui) 有95%的區間抓到(包含)真正的總體(ti) 參數值。
第三,置信區間是估計總體(ti) 參數值的,不是估計總體(ti) 中某一個(ge) 個(ge) 體(ti) 或者某些個(ge) 體(ti) 的取值範圍,所以碰到這種關(guan) 於(yu) 個(ge) 體(ti) 類(比如取值範圍、個(ge) 數)的說法一定是錯誤的。
第四,根據一個(ge) 隨機樣本計算出來的特定區間,無法將該區間推廣到別的樣本上,也就是任何一個(ge) 樣本要想計算置信區間,隻能根據抽取到的樣本數據進行計算,沒有捷徑可走。
第五,因為(wei) “總體(ti) 參數值未知但其是一個(ge) 固定值”的屬性,由一個(ge) 樣本計算出來的置信區間,我們(men) 永遠無法確定該區間是否包含總體(ti) 參數值。如果參數值落在該區間,那麽(me) 該區間包含參數值的概率為(wei) 1,如果參數值未落在該區間,那麽(me) 該區間包含參數值的概率為(wei) 0。所以我們(men) 可以總結出來一個(ge) 結論:根據一個(ge) 樣本計算出來的置信區間,其包含真實總體(ti) 參數值的概率隻可能為(wei) 1或0這兩(liang) 個(ge) 值。
第六,根據置信水平最本質的含義(yi) “從(cong) 同一個(ge) 總體(ti) 重複抽樣(樣本量一致),會(hui) 根據所抽到的樣本得到不一樣的95%置信區間,但是這些區間中,會(hui) 有95%的區間抓到(包含)真正的總體(ti) 參數值。”我們(men) 可以獲知,在重複抽取的多個(ge) 樣本構建的置信區間中,包含參數的區間的占比為(wei) 95%,但到底是哪個(ge) 樣本構建的區間是包含參數我們(men) 永遠無法得知。
根據以上六條判別標準,我們(men) 可以拿下所有的關(guan) 於(yu) 置信水平和置信區間解釋的題目。比如,開篇提到的題目:
其中A、B選項裏列出的measurements指的是個(ge) 體(ti) 的測量值,可以利用第三條判斷其是錯誤選項。
C選項中,區間估計是去估計總體(ti) 參數的,不是去估計樣本統計量的,且12到18是根據一個(ge) 特定抽取出來的樣本計算出來的範圍,無法用其來確定別的樣本對應的區間範圍。
D選項,落於(yu) 12到18的概率隻可能是1或者0,所以這道題選E。我們(men) 來分析E選項,如果總體(ti) 均值是19,那麽(me) 該樣本的區間12到18為(wei) 不包含19的區間,利用第二條得知,重複抽樣構建的多個(ge) 區間中,不包含參數的區間占比僅(jin) 為(wei) 5%,所以是less likely (後者unlikely)to occur。
接下來,我們(men) 再看兩(liang) 道典型的真題。
本題答案選B。
A選項,利用判別標準六條中的第四條“根據一個(ge) 隨機樣本計算出來的特定區間,無法將該區間推廣到別的樣本上,也就是任何一個(ge) 樣本要想計算置信區間,隻能根據抽取到的樣本數據進行計算”。所以我們(men) 無法得知別的樣本計算的區間範圍也是6.73 到7.67。
C和D的典型錯誤就是95% of the students。E的典型錯誤也是a student,都可以利用判別標準中的第三條“置信區間是估計總體(ti) 參數值的,不是估計總體(ti) 中某一個(ge) 個(ge) 體(ti) 或者某些個(ge) 體(ti) 的取值範圍,所以碰到這種關(guan) 於(yu) 個(ge) 體(ti) 類(比如取值範圍、個(ge) 數)的說法一定是錯誤的。”
正確答案B選項,就是置信水平最本質的含義(yi) ,也就是判別標準的第二條。
本題答案為(wei) A。
A選項就是判別標準的第一條,陳述了margin of error的字麵意思。B選項中的majority代表了數據個(ge) 數,利用判別標準第三條可以排除。C選項的典型錯誤,可以利用第四條排除,根據一個(ge) 樣本計算的區間無法推廣到別的樣本計算的區間。D選項可以利用第五條以及第四條進行排除,永遠無法得知根據一個(ge) 樣本計算出來的區間估計是否包含真實的總體(ti) 參數值。E選項也是利用一個(ge) 樣本計算的統計量的值我們(men) 無法得知是否等於(yu) 真實的總體(ti) 參數值。
相信看到這裏,同學們(men) 應該明確了,我們(men) 常用的置信水平95%的含義(yi) 。通過這個(ge) 考點也讓我們(men) 明白了,這種類型的題目並不是通過大量刷題可以掌握的。
同學們(men) 一定要在複習(xi) 備考過程中,先理解掌握相應的概念考點,在此基礎上高效的利用真題,可以達到複習(xi) 事半功倍的效果!
評論已經被關(guan) 閉。