各位AP小夥(huo) 伴們(men) 好呀~2022年5月5日進行的AP統計考試已經結束,本場考試為(wei) 線下紙筆考試,CB官網已更新了2022AP統計北美FRQ真題。
整體(ti) 分析
今年這套北美卷的難度非常適中,和以往考題的相似度極高。
並且最難的FRQ6難度相較於(yu) 以往難度也是偏低的,因此考生隻要之前的複習(xi) 充分,不難考出好成績。下麵我們(men) 來逐題分析每個(ge) 題目的知識點以及對應做法。
逐題分析
第一題:
這道題的背景很有意思,生物學家調查了11隻牛蛙的長度與(yu) 重量,並給出scatterplot。四個(ge) 小問分別考察到了:描述圖表、度量值的描述、residual的定義(yi) 。
(a)需要同學們(men) 描述重量與(yu) 長度的關(guan) 係。是非常常規的描述圖表類問題。考生隻需要從(cong) direction、form、strength和outlier四個(ge) 點入手即可。從(cong) 圖像來看,重量與(yu) 長度的關(guan) 係是相對較強的positive linear relationship。
(b)考察關(guan) 於(yu) slope of regressionline 的描述。這個(ge) 部分有固定套路,即為(wei) 當x increaseby one unit, then the predicted value of y increase by constant。
(c)考察關(guan) 於(yu) coefficientof determinant 的描述。同b問有固定答題模板。即為(wei) there are —— percent of variability in y canbe explained by regression line on x。前三小問都是需要in context,也就是將套話中的x與(yu) y帶換成題目中的length與(yu) mass。
(d)考察關(guan) 於(yu) residual的定義(yi) 以及回歸線的高估與(yu) 低估。考生需要知道residual的定義(yi) 為(wei) 某點的實際值-預測值。從(cong) 而在(i)小問中找到residual的絕對值最大的點。進而根據residual的正負回答下一問,即(ii)小問中regression line 高估還是低估實際值。這部分同學們(men) 要注意:residual大於(yu) 0,代表回歸線低估實際值;residual小於(yu) 0,代表回歸線高估實際值。
第二題:
這一題目說到了關(guan) 於(yu) 某一個(ge) 新treatment與(yu) 治療痘痘之間的關(guan) 係。考察到了unit 3當中實驗部分的知識點,包括:實驗術語、matched pair 的優(you) 點以及random assignment的過程。
(a)考察實驗術語,這題難度不大。treatment為(wei) 新藥物和舊藥物, experimental unit 是人,response variable為(wei) 最終痘痘的評分。
(b)這一問問的是matched pair design相比於(yu) block design的優(you) 點。實際上matched pair是一種特殊的block,但每個(ge) blcok隻有2個(ge) 相似的人。所以paired design不僅(jin) 可以使得實驗數據的variability更加小,更加方便比較2個(ge) treatment的不同,還更能保證接受treatment1與(yu) treatment2的人們(men) 完全一致,更好的控製變量。
(c)考察關(guan) 於(yu) random assignment people的過程。我們(men) 需要首先給人們(men) 進行編號(label),接下來用random number generator找到一半的數字,這些數字的人們(men) 對應接受treatment1,其餘(yu) 接受treatment 2。(PS:其餘(yu) 隨機分組方式譬如抽簽也是正確的,這裏隻是提供一個(ge) 模板)
第三題:
題目背景是罐裝洗發水的機器,每次罐裝的量會(hui) 有波動。進而問道一些概率問題。考察到了 normal distribution、binomial distribution的概率計算。
(a)這道題目說某瓶洗發水淨含量小於(yu) 0.5為(wei) 不合格,求不合格的概率。已知洗發水罐裝的量X服從(cong) 正態分布,求mean=0.6,standard derivation為(wei) 0.04. 求X小於(yu) 0.5的概率。同學們(men) 利用計算器裏的normal CDF即可算出正確答案。
(b)這一問是說抽10瓶洗發水檢查,如果2瓶以上洗發水為(wei) 不合格,那麽(me) 整個(ge) 生產(chan) 線都會(hui) 被認為(wei) 有問題。求生產(chan) 線被認為(wei) 有問題的概率。上一問已經計算出一瓶洗發水不合格的概率,假設為(wei) a。那麽(me) 10瓶洗發水當中不合格的數量B服從(cong) binomial distribution, n=10,p=a。隻需要利用計算器的binomial CDF計算B大於(yu) 等於(yu) 2的概率即可。
(c)這一問說若每瓶洗發水重量分布變成mean=0.56, standard derivation為(wei) 0.03的正態分布,那麽(me) 整條生產(chan) 線會(hui) 被拒絕的概率會(hui) 變大還是變小?這道題目可以直接利用新分布算出每一瓶洗發水不合格的概率(可以看出應該是比A問算出的結果更大),從(cong) 而解釋每一瓶洗發水不合格的概率都變大,整體(ti) 生產(chan) 線被拒絕的概率更大。
第四題:
這一題求all teenagers想要 video streaming service 的比例問題。考察關(guan) 於(yu) 區間構造以及區間含義(yi) 。
(a)這一問考察構造區間的四步法(同學們(men) 可以參考TD原創的FRQ解題核心四步法這一份文件,裏麵有非常詳細的解釋和說明)。第一步根據問題選擇合適的interval—oneproportion z interval;第二步驗證 random、normal、independence三個(ge) 條件;第三步利用計算器進行計算;最後一步描述剛剛算出的區間即可。
(b)這一問考察區間的含義(yi) :區間內(nei) 的值都是可信的population parameter。通過分析題目中說的0.5是否在區間當中得到結論即可。
第五題:
這一題探究黑白巧克力對降血壓的幫助。考察到了median的計算、test的作用以及 p value的定義(yi) 。
(a)這一問讓同學們(men) 分別計算出黑、白巧克力的median並進行比較,屬於(yu) 常規計算類問題。
(b)給出樣本均值差為(wei) 5.66mmHg,問同學們(men) 為(wei) 何不能得出檢驗結論。這道題目看起來比較難寫(xie) 。實際上我們(men) 隻要寫(xie) 出如下內(nei) 容即可:抽樣有波動性,不通過概率計算的方式來判斷樣本是否極端(即不計算p value),是無法直接從(cong) 樣本數據中判斷出檢驗結論的。
(c)這一題與(yu) 2009 年北美FRQ真題Form B卷的第5題非常相似。即為(wei) 給出sampling distribution of sample mean difference的simulation。讓同學們(men) 計算出 pvalue,從(cong) 而下檢驗結論。p value 是比我們(men) 抽樣得到的樣本還要極端的概率,我們(men) 通過simulation可以看出,比5.66還大的概率就是p value(約為(wei) 3/120)。
第六題:
比較2個(ge) 醫院對於(yu) 病患的治愈率。考察了基礎概率計算、因果關(guan) 係結論以及概率理解。
(a)這一問需要學生根據two way table算出conditional probability,並在第二問比較2個(ge) 醫院整體(ti) 治愈率的大小。
(b)問我們(men) 通過上麵的數據,能否得到不同醫院導致不同治愈率的關(guan) 係。考生需要注意:題目當中出現了cause這個(ge) 詞語,代表題目詢問我們(men) 能否得到因果關(guan) 係,而 cause and effect relationship是需要做實驗才能得到的,因此同學們(men) 隻需要分析題目中是否在做實驗(或者是否進行了random assignment即可),注意如果沒有做實驗,則不能得到因果關(guan) 係。
(c和d)小問主要考察學生對於(yu) 概率的理解。這問題將病患分成輕症與(yu) 重症,並在c問要求我們(men) 分別計算2個(ge) 醫院對於(yu) 輕重症病患的治愈率,發現不管對於(yu) 輕症患者還是重症患者,B醫院的治愈率都是更高的。
(d)這一問要求我們(men) 解釋為(wei) 什麽(me) 分開來看,B醫院的治愈率都更高,但將輕重證病人合起來計算之後,B醫院的治愈率反而更低了?這個(ge) 問題是統計學上很有意思的辛普森悖論,考綱中沒有,感興(xing) 趣的同學可以仔細上網查找。解決(jue) 這個(ge) 問題的思路主要是:輕重症病人人數不同,但輕症的治愈率本身相對於(yu) 重症更高。而對於(yu) b醫院來說,重症病人人數太多,重症病人較低的治愈率稀釋了整體(ti) 治愈率。
評論已經被關(guan) 閉。