AP統計5分衝刺攻略:估計estimation知識點分析

上一期的推送中,我們(men) 一起了解了假設檢驗(hypothesis testing) —— 一種基於(yu) 收集到的樣本數據推測總體(ti) 參數的方法——我們(men) 還使用這種方法嚐試驗證了各種各樣的假設。

但是呢,假設檢驗其實隻是其中一種進行統計推斷(statistical inference)的方式。今天,我們(men) 將要在我們(men) 的統計推斷工具箱裏加入另一種有用的工具——估計(estimation)

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

本 文 目 錄

1.Estimation

  • Point Estimator

  • Interval Estimator

2.Confidence Level& Confidence Interval (CI)

  • Introduction

  • Construction of CI

A. CI for proportion

B. CI for mean(σ known)

C. CI for mean(σ unknown)

3. Choosing Sample Size

Estimation

由於(yu) 因為(wei) 收集總體(ti) 數據是一件非常費時費力的事情,所以我們(men) 常常會(hui) 通過收集樣本的方式去推測關(guan) 於(yu) 總體(ti) 的情況。我們(men) 進行估計(estimation)的目的,其實就是想要通過樣本數據(sample statistic)確定總體(ti) 參數(population parameter)的粗略值。

有兩(liang) 種不同類型的估計量(estimator)可以供我們(men) 使用:點估計量(point estimator) 區間估計量(interval estimator)。讓我們(men) 一起來康康它們(men) 的區別吧!

1、Point Estimator

假如在我生日那天,我收到了一盒超級大盒的巧克力,我想知道在這盒巧克力裏,我最愛的抹茶味巧克力大概占多少比例,我應該怎麽(me) 做呢?把一塊塊巧克力都拿出來實在是太麻煩了,所以我打算先吃個(ge) 10塊巧克力,然後數一下這10塊巧克力裏有幾塊是抹茶味的。

吃完後我發現這10塊巧克力裏有一半都是抹茶巧克力,根據這個(ge) 樣本,我推測抹茶巧克力占這整盒巧克力的50%。

在這個(ge) 例子中,我通過樣本數據(10塊巧克力裏,50%是抹茶巧克力)所推測出的總體(ti) 參(抹茶巧克力在整盒巧克力裏的占比)“50%” 就是一個(ge) 點估計量,因為(wei) 它是一個(ge) 精確的數字,而不是某個(ge) 含糊的範圍。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖1

【重點概念】

Point Estimator(點估計量):a single number based on sample data that is used to estimate a population characteristic(見圖1). 概念理解就好,不需要記憶,能與(yu) interval estimator (區間估計量)區分即可!

不過呢,你可能會(hui) 想到,雖然我剛才吃的10塊巧克力裏有50%的抹茶巧克力,但如果我再吃10塊巧克力,或許隻能吃到1塊抹茶巧克力,那麽(me) 我得到的點估計量就變成10%了。確實,我們(men) 在不同的樣本中可能會(hui) 得到不同的數據,從(cong) 而得到不同的點估計量。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖2

在圖2中,我們(men) 可以觀察到,有些點估計量與(yu) 總體(ti) 參數相差無幾,但有些點估計量卻差了十萬(wan) 八千裏,這就與(yu) 我們(men) 所選擇的樣本的質量有關(guan) 係。

那麽(me) 什麽(me) 樣的樣本能夠給我們(men) 更準確、更接近總體(ti) 真實情況的估計呢?

一個(ge) 好的樣本至少要滿足兩(liang) 個(ge) 條件:

1)它是無偏的(unbiased)

2)它的變異性(variability)較小

如果一個(ge) 樣本的抽樣分布(sampling distribution)平均值等於(yu) 總體(ti) 參數分布的平均值,我們(men) 就可以說這個(ge) 樣本是無偏的(unbiased)

在圖3中,藍色的曲線代表總體(ti) 參數的分布情況,綠色和紅色的曲線分別代表兩(liang) 個(ge) 不同的樣本抽樣分布。相比紅色的樣本,綠色的樣本是一個(ge) 更好的樣本,因為(wei) 它的抽樣分布平均值正好與(yu) 總體(ti) 分布的平均值相等,是無偏的。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖3

但是,如果我們(men) 有幾個(ge) 無偏的樣本可以選擇,這時候選擇哪一個(ge) 樣本更好呢?

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖4

在這種情況下,我們(men) 要選擇變異性(variability)最小的樣本,也就是數據標準差(standard deviation)最小的樣本。

在圖4中,藍色的曲線依然代表總體(ti) 參數的分布情況,粉色和橙色的曲線分別代表兩(liang) 個(ge) 不同的樣本抽樣分布。因為(wei) 這兩(liang) 個(ge) 樣本都是無偏的,所以我們(men) 要通過觀察它們(men) 的標準差進行判斷。對一個(ge) 抽樣分布而言,它的形狀越高越瘦,標準差越小;越矮越胖,標準差越大。因此,我們(men) 應該選擇分布形狀最高最瘦的粉色樣本。

2、Interval Estimator

再讓我們(men) 回到抹茶巧克力的例子。當我得到點估計量(估計抹茶巧克力在整盒巧克力裏的占比)50%時,我有多大的把握呢?

其實我是沒有太大把握的,畢竟一下就能找到總體(ti) 參數的確切值是很難的。但是,如果我推測抹茶巧克力在整盒巧克力裏的占比大概是在40%-60%之間,我對自己的預測是否會(hui) 更有信心呢?

答案是肯定的。因為(wei) 讓我們(men) 預測的某個(ge) 區間包含總體(ti) 真實參數,一定比直接找到那一個(ge) 具體(ti) 的總體(ti) 真實參數要更容易一些。這裏的40%-60%就是一個(ge) 區間估計量(interval estimator):一個(ge) 關(guan) 於(yu) 區間的預測,見圖5。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖5

Confidence Level & Confidence Interval (CI)

1、Introduction

區間估計量有一個(ge) 特殊的名字,叫置信區間(confidence interval)。一個(ge) 總體(ti) 參數的置信區間,指的是一個(ge) 包含了所有對這個(ge) 總體(ti) 參數的估計值的區間,換句話說,就是我們(men) 預測總體(ti) 參數會(hui) 落在我們(men) 所構造的置信區間上。

【重點概念】

Confidence Interval(CI): a confidence interval for a population characteristic is an interval of plausible values for the characteristic.

盡管相比點估計量,我們(men) 對自己所估計的置信區間會(hui) 更有信心,但別忘了,我們(men) 始終是在做一種預測和估計,很難100%確定我們(men) 所做的估計一定能夠反應總體(ti) 的真實情況。對於(yu) 不同的區間大小,我們(men) 會(hui) 擁有不同的信心程度。

想想看,如果現在請你盲猜我的身高,比較140-180cm,150-170cm, 160-165cm,163-164cm這幾個(ge) 你有可能會(hui) 給出的置信區間,你對哪個(ge) 區間最有信心呢?或者說,你認為(wei) 哪個(ge) 區間最有可能包含我的真實身高呢?

我們(men) 會(hui) 發現,相比其他三個(ge) 區間,我們(men) 應該對140-180cm最有信心。也就是說,置信區間越大,我們(men) 的信心程度應該會(hui) 更高,因為(wei) 越大的置信區間可以包含越多的可能性,也越有可能將真實值包含在裏麵

現在我們(men) 將要介紹一個(ge) 與(yu) 置信區間相關(guan) 聯的概念:置信水平(confidence level)

和我們(men) 對某個(ge) 區間的信心程度不同,置信水平反映的是我們(men) 對構造置信區間所用的方法的信心程度,或這個(ge) 方法的成功率,它的數值等於(yu) :在構造總體(ti) 參數的多個(ge) 樣本區間中,包含總體(ti) 參數的區間占總數之比。

是不是有點抽象?讓我們(men) 來試著通過分析一個(ge) 具體(ti) 的置信水平來理解它的含義(yi)

一個(ge) 85%的置信水平代表著什麽(me) 呢?下麵這幅圖(圖6)展示了基於(yu) 20個(ge) 隨機樣本所構建的20個(ge) 置信區間,總體(ti) 參數值(true proportion) 表示為(wei) 圖中綠色的橫線。有一些區間包含了總體(ti) 參數值(successfully capture),有一些卻沒有(miss)。如果我們(men) 認真數一數,就會(hui) 發現:20個(ge) 區間中,有17個(ge) 置信區間成功地包含了總體(ti) 參數值,占總區間的85%。

這意味著,我們(men) 用同樣的方法隨機抽取20個(ge) 樣本,構造了20個(ge) 置信區間,其中有85%的區間成功包含了總體(ti) 參數值,成功預測了總體(ti) 參數值所在的範圍。這就是confidence level = 85%所表示的含義(yi) 。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖6

【Tips提示】

在我們(men) 構造置信區間的過程中,所使用的常見的置信水平包括:90%,95%, 99%

【重點概念】

Confidence Level:The confidence level associated with a confidence interval estimate is the success rate of the method used to construct the interval.

概念不要求記憶,但要理解!注意置信水平指的是我們(men) 對構建某個(ge) 置信區間所用的方法的信心程度,也指用這個(ge) 方法所構造的置信區間包含總體(ti) 參數的成功率。

【考點提示】

FRQ和選擇題都有可能考察我們(men) 是否能夠解釋特定confidence level 的含義(yi) 。如果FRQ讓我們(men) “explain the meaning of n% confidence level in the question”,大家可以使用這個(ge) 模板:

  • ?If many,many samples are selected and many,many confidence intervals are calculateds,about n% of them will capture the true (題目想要推測的 population parameter) .

1、Construction of CI

接下來,我們(men) 將學習(xi) 如何構建一個(ge) 置信區間。置信區間的大小總是和某個(ge) 置信水平相關(guan) 聯,我們(men) 設置的置信水平越高,在這一水平下構建的置信區間就會(hui) 越寬,因為(wei) 一個(ge) 比較大的區間包含總體(ti) 參數值的可能性越高。

讓我們(men) 以95%的置信水平為(wei) 例,來構造它所對應的置信區間吧!

首先,我們(men) 要利用正態分布表查找,當中間的麵積占整個(ge) 正態分布曲線的95%時,中間麵積的兩(liang) 個(ge) 邊界所對應的z-score。因為(wei) 正態分布曲線以下的麵積合為(wei) 1,當中間麵積占0.95,兩(liang) 邊兩(liang) 個(ge) 相等的麵積就應該各占0.025,然後查表可以得到兩(liang) 個(ge) 邊界的z-score為(wei) -1.96和1.96,見圖7。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖7

當樣本數量n足夠大或總體(ti) 分布呈正態分布時,我們(men) 就可以說這些樣本所構成的抽樣分布(sampling distribution)近似呈正態分布,如果我們(men) 對所有樣本數據進行標準化(standardize,計算出這些數據的z-score),這個(ge) 抽樣分布就可以用圖7表示。

一個(ge) 數據的z-score= n的意思是:這個(ge) 數據離平均值的距離等於(yu) n個(ge) 標準差

所以我們(men) 在上文計算出的兩(liang) 個(ge) 臨(lin) 界值z-score就代表著:如果樣本所組成的抽樣分布成正態分布,95%的樣本數據會(hui) 落在“這個(ge) 分布的平均值±1.96個(ge) 標準差”這一區間內(nei) 。這就是置信水平95%所對應的置信區間。

在上文我們(men) 提到過,置信水平描述的是我們(men) 對自己所使用的構造置信區間的方法所擁有的信心大小,也就是說,假設我們(men) 抽取很多個(ge) 樣本,我們(men) 可以利用這些樣本構造無數個(ge) 同樣大小的置信區間,而我們(men) 相信95%的這些區間可以成功包含總體(ti) 參數。

為(wei) 什麽(me) 當我們(men) 在抽樣分布上計算出一個(ge) 區間,使得95%的樣本數據落在這個(ge) 區間上,我們(men) 就可以說這就是置信區間,代表在無數個(ge) 樣本區間中,其中95%可以包含總體(ti) 參數呢?

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖8

【考點提示】

有時候FRQ也會(hui) 讓我們(men) 解釋某個(ge) 特定置信區間(CI)的含義(yi) 。

我們(men) 的解釋一定要包含兩(liang) 個(ge) 關(guan) 鍵點:

1)這個(ge) 置信區間所對應的置信水平(CL)

2)區間本身。

這邊給大家提供一個(ge) 好用的句式:

  • ? I am n%(CL) confident that the true proportion/mean(二選一,取決(jue) 於(yu) 數據類型)value of (題目想要推測的population parameter) is contained within the interval (__ , __)(CI).

了解了構造置信區間的原理後,推測它的計算公式就變得非常容易啦!針對不同的數據類型,計算公式會(hui) 稍有差異,讓我們(men) 來逐一看看吧~

  • A. CI forproportion

如果我們(men) 想要預測的總體(ti) 參數是離散型數值變量(discrete numerical variable),那麽(me) 這個(ge) 參數和收集到的樣本數據應該由proportion(比例)表示。

在抽樣分布(sampling distribution)一章中,我們(men) 知道關(guan) 於(yu) proportion的抽樣分布有三個(ge) 特點

在我們(men) 探索構建置信水平為(wei) 95%的置信區間時,我們(men) 得到了這樣一個(ge) 區間:平均值±(1.96)標準差,我們(men) 其實可以把它推廣到構建其他置信水平的區間上。那麽(me) ,我們(men) 就可以得到置信區間的計算公式:平均值±(critical value)(標準差)

當我們(men) 要構建proportion的置信區間時,我們(men) 可以把一個(ge) 樣本的平均值和標準差帶入,得到:

【Tips提示⚠️常見的置信水平所對應的zcritical value是:90%--- 1.645,95%--- 1.96,99%--- 2.58,記下來可以節省計算時間!

  • B. CI for mean (σknown)

如果我們(men) 想要預測的總體(ti) 參數是連續性數值變量(continuous numerical variable),那麽(me) 這個(ge) 參數和收集到的樣本數據應該由mean(平均值)表示。

關(guan) 於(yu) mean的抽樣分布有三個(ge) 特點

同構建proportion的置信區間非常相似,mean的置信區間應該是:

  • C. CI for mean (σunknown)

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖9

【重點概念】

不需要記憶,隻是為(wei) 了輔助大家理解!

  • t-distribution: the probability distribution that estimates the population parameters when the sample size is small and the population standard deviation is unknown.

  • degree of freedom (df): the maximum number of logically independent values, which are values that have the freedom to vary, in the data sample.

解析

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖10

Choosing Sample Size

在開始收集樣本之前,我們(men) 要先確定,為(wei) 了在我們(men) 所選擇的置信水平上對總體(ti) 參數進行預測,我們(men) 至少要收集多少樣本量(sample size),畢竟收集樣本是一件費時費力有時還費錢的事情,但樣本量過小又會(hui) 影響我們(men) 預測的準確度。

我們(men) 可以用“平均值±(critical value)(標準差)”來構造置信區間,其中“(criticalvalue)(標準差)”叫做邊際誤差(margin of error,ME),因為(wei) 這個(ge) 值代表著對平均值的偏離大小。當我們(men) 選定了自己可以容忍的誤差範圍,也就是確定了ME的大小後,就可以計算最小樣本量(minimum sample size)了:

這時候你可能會(hui) 問了:我怎麽(me) 知道p和ó的值是多少呢?不就是因為(wei) 對總體(ti) 一無所知,我們(men) 才會(hui) 去收集樣本進行推測的嗎?

確實,但我們(men) 也隻是在對可能需要的樣本量做粗略的估計。雖然我們(men) 不知道p和ó的準確值,但我們(men) 可以估計,比如先進行一個(ge) 小範圍的預研究(preliminary study)或者基於(yu) 過去的經驗和研究數據。如果我們(men) 真的沒有任何相關(guan) 經驗,我們(men) 可以對p進行一個(ge) 最保守的估計,假定p=(1-p)=0.5,因為(wei) 這時p和1-p的乘積是最大的(見圖11),可以保證相對大的樣本量,使我們(men) 得到較為(wei) 準確的結果和預測。

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖11

對於(yu) ó來說,公式ó≈range/4可以近似估計它的值。(至於(yu) 為(wei) 什麽(me) ,感興(xing) 趣的同學可以前往https://www.thoughtco.com/range-rule-for-standard-deviation-3126231。因為(wei) 不是重點內(nei) 容,這裏就不多贅述啦。)

現在再讓我們(men) 來做道題!

練習(xi)

Suppose a mobiles phones company wants to determine the current percentage of customers ages 50+ who use text messaging on their cell phoness. How many customers ages 50+ should the company survey in order to be 90 percent confident that the estimated (sample) proportion is within 3 percentage points of the true population proportion of customers ages 50+ who use text messaging on their cell phoness? Assume that p′ =0.5.

解析

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

圖12

【易錯點】

算出來的最小樣本量n如果是一個(ge) 小數,我們(men) 要把這個(ge) 小數近似成比它大的最小整數。比如7517≈752,36.1≈37,20.45≈21,而不是四舍五入噢!因為(wei) 我們(men) 希望在資源允許的情況下獲取盡可能大的樣本量,以讓我們(men) 做出準確的預測。

【Tips提示⚠️其實大家不用特意去記計算最小樣本量的公式的!因為(wei) 它可以由置信區間中的邊際誤差ME=(critical value)(standard deviation) 推出來!

結 語

希望這期推送能幫助你掌握estimation這種統計推斷方法,學會(hui) 通過構造置信區間預測總體(ti) 參數所在的大致範圍。

老師為(wei) 大家總結了下麵利用下麵這張思維導圖,快來來check一下你的掌握程度吧!

【AP統計】想衝(chong) 刺5分?那你一定不能錯過這個(ge) !

【競賽報名/項目谘詢+微信:mollywei007】

上一篇

2022年牛津大學理科筆試錄取數據分析

下一篇

CPT和OPT有什麽區別?在美國研究生商業分析專業就業崗位多嗎?

你也可能喜歡

  • 暫無相關文章!

評論已經被關(guan) 閉。

插入圖片
返回頂部