作為(wei) AP為(wei) 數不多的數學科目之一,AP統計逐漸成為(wei) 理科生們(men) 的必爭(zheng) 之地。
據統計,在2020年網考的情況下,AP統計考生人數有十八萬(wan) 之多,在AP理科中的占比僅(jin) 次於(yu) 微積分AB與(yu) 生物。
但當我們(men) 談論起AP統計的時候,說法卻各種各樣。有人說統計難於(yu) 微積分,學了半天都沒找著門道;還有考生說這簡直是AP中最簡單的一科了,學了就能拿4分,稍微努力一下能得5分。
實際上,這是源於(yu) AP統計的特殊性。在統計裏幾乎沒什麽(me) 複雜的計算,計算器代勞了一切的公式與(yu) 算式。但是裏麵的概念卻是繞著彎的,一環扣一環。拿高分的重點並不在於(yu) 數學解題的邏輯思維,而是如何把一個(ge) 個(ge) 概念放到各個(ge) 實驗的具體(ti) 場景中。
抽樣 Sampling
我們(men) 常說的抽樣檢測就是AP統計的範圍,一個(ge) 抽樣(Sampling),一個(ge) 實驗(Experiment),最後進行假設檢驗(Hypothesis test),這就成功完成了一個(ge) 研究。這類的基礎知識,是無論進行哪一個(ge) 理科科目地學習(xi) 都必須要具備的。
所以超級重要,好好學!
簡單來說,抽樣(Sampling)就是從(cong) 總體(ti) (population)中提出樣本(sample)的過程。目的就是為(wei) 了省事,不用對(量大的)總體(ti) 進行一個(ge) 個(ge) 檢測,而是通過測其中一些有代表性的樣本數據再反推總體(ti) 的數據。
而最簡單的也是我們(men) 常說的抽樣方式,就是簡單隨機抽樣(Simple Random Sampling),從(cong) 總體(ti) 中隨機抽取樣本。那麽(me) 如何做到隨機,這時統計就派上用場了。
1. 把總體(ti) 中每個(ge) 個(ge) 體(ti) 的數字作為(wei) 標簽
2. 通過計算器,隨機產(chan) 生幾個(ge) 數字
3. 這些選出的數字所對應的個(ge) 體(ti) ,就組成了我們(men) 所需要的樣本
其實,就是以數字的方式代替所有的人或物,再通過數學的方法進行隨機抽取。
除了最直接的簡單隨機抽樣,還有幾種適合不同場景的抽樣調查方法。比如考試經常出現的分層隨機抽樣(Stratifiedrandom sampling)和整群隨機抽樣(Cluster random sampling)。
分層隨機抽樣(Stratifiedrandom sampling)是先將總體(ti) 按照一個(ge) 標準分層,每層中抽取固定個(ge) 數的個(ge) 體(ti) ,組成樣本。
這種方式的適用場景是在總體(ti) 分層後,每層的差距比較大,不過層內(nei) 部的個(ge) 體(ti) 差異不大。
比如:當校長想要知道這個(ge) 高中裏學生對學校的滿意度,可以根據年級把所有學生分三層,每個(ge) 年級是一層。再從(cong) 每個(ge) 年級的學生中都挑20個(ge) ,最後一共有60人被抽出,也就是樣本。這種時候同一年級,也就是同一層的學生差距並不大,學的知識都差不多。但是高一和高三的學生比,就相差比較多。
↑這是我們(men) 所說的適用於(yu) 分層隨機抽樣的情況。
整群隨機抽樣(clusterrandom sampling)則是和分層隨機抽樣完全相反的另一種方法。是在總體(ti) 分組後,隨機抽取其中一或多個(ge) 組的所有個(ge) 體(ti) 成為(wei) 樣本。
這種方式適用於(yu) 組和組之間差距不大,但是組內(nei) 多樣性高的情況。
比如:想要知道高三年級的同學在數學課堂上的表現,可以先根據班,把所有學生分成不同組,一個(ge) 班為(wei) 一組。直接抽取其中兩(liang) 個(ge) 班,各做一次公開課就能得到結果。這時班和班的差距其實並不大(沒有實驗班),但是班級內(nei) 部有很喜歡聽課的同學,也有很不喜歡上課的同學,這會(hui) 導致差異性比較大。
和分層隨機抽樣相比,整群隨機抽樣的操作難度一下子降低了,不用到處跑來跑去拜訪所有層,但是大多時候很難像分層隨機抽樣,保證樣本足夠多樣性。
選擇合適的抽樣方式,並且能通順不出錯地寫(xie) 出來可是超級超級超級重要的!
比如,某年真題考到量森林中樹的維度:一共上百畝(mu) 的森林,可以選擇整群抽樣,隻隨機測幾畝(mu) 森林裏所有樹的維度,這樣肯定方便。但更好的方式則是在每一畝(mu) 都挑幾棵樹來測維度,雖然麻煩,但是因為(wei) 每一畝(mu) 地的陽光,土壤資源都不一樣,這樣的方式保證了樣本和總體(ti) 更加匹配。
最後還有一種隨機抽樣的方法,叫做等距抽樣(Systematic random sampling)。第一步不再是分組,而是要把總體(ti) 中的所有個(ge) 體(ti) 按某種順序排列,抽取每次的第k個(ge) 作為(wei) 樣本。
這種與(yu) 眾(zhong) 不同的方法在考試中並沒有前麵三種考的頻繁,但也是重點之一。
舉(ju) 個(ge) 例子:籃球隊選參賽人,先按照高矮個(ge) 把所有人排好順序,從(cong) 中抽取第三個(ge) ,第六個(ge) ,第九個(ge) ,第十二個(ge) ......作為(wei) 樣本(其實就是每次的第三個(ge) )。這種方法固然可以保證樣本與(yu) 總體(ti) 的相似性,但也要注意避免讓排列好的總體(ti) 有任何的重複。如果籃球隊員的排列方式是170,180,185,170,180,185... 有可能每次挑出來的籃球隊員都是身高180哦。
抽樣偏差 Sampling Bias
有好的抽樣方法,就肯定存在有問題的方法,也就是抽樣調查中出現的各種Bias。 比如從(cong) 一開始就出現覆蓋不全的偏差(undercoverage bias)。顧名思義(yi) ,undercoverage指的是抽取樣本時,並沒有在應該的總體(ti) 中抽取,而是漏掉了從(cong) 一部分中的一個(ge) 更小的總體(ti) 中抽取。
比如電話抽樣問題:當政府領導想要調查市民對於(yu) 新政策的意向時,從(cong) 電話本上隨機抽取一些人的電話詢問他們(men) 的意見。這看起來流程沒什麽(me) 問題,實際上從(cong) 最開始的電話本就錯了。
電話本很難保證覆蓋所有市民的電話,那電話沒登記在電話本上該怎麽(me) 辦呢?這些人的意見就直接被放棄了嗎?因此除非題目表示電話本上有所有人的電話,否則隻要一提電話抽樣,那肯定出現了undercoverage bias。
電話調查不僅(jin) 有覆蓋不全的偏差,同時也很容易出現其它兩(liang) 種偏差:不回答偏差(Nonresponsebias)和回答偏差(Response bias)。 不回答偏差(Nonresponse bias)是打了電話但對方沒接,或者打通了可對方拒絕回答。
隻要沒得到想要的答案,都算是nonresponse bias。 與(yu) 之相反的回答偏差(Response bias)指的是得到了關(guan) 於(yu) 問題的回答,可是對方回答的並不是心裏想的,或者並不是真實情況。比如打電話問道“你是否偷過東(dong) 西”,一些真正偷過東(dong) 西的人可能就會(hui) 因為(wei) 麵子說沒有。
這兩(liang) 個(ge) 問題並不隻會(hui) 在打電話時存在,如果麵對麵問一些敏感問題,可能更容易出現。不過好在兩(liang) 個(ge) 都有相應的解決(jue) 辦法。
比如通過隨機抽取更多的人,彌補上不接電話或者不回答人數的缺口,又比如通過匿名等保護信息的方式,讓實驗對象不受麵子的影響,從(cong) 而願意說真話。
實驗 vs 觀察研究
Experiment vs. Observational study
當抽樣完成之後,被實驗的對象也就都足夠了。那如何通過一係列的操作,從(cong) 實驗對象中得到需要的數據,則是我們(men) 後麵研究的部分。 在日常生活中簡單又常見的方式,問卷調查(Survey),它其實並不能被稱為(wei) 一個(ge) 實驗,因為(wei) 它隻能被叫做一種觀察研究(Observational study)。這類觀察研究的特點,就是不對實驗對象做出任何的改變。
比如:想要研究文化水平與(yu) 收入之間的關(guan) 係,通過問卷調查100人的文化水平與(yu) 收入,得出結論。此時研究對象並沒有被動的文化水平低或者高,也沒有被動地掙得更多或者更少。
研究人員發了問卷,隻起到了觀察的作用,並沒有進行實質性的改變,這種就是觀察研究。
那什麽(me) 才是一個(ge) 真正的實驗(Experiment)呢?答案有改變的實驗叫做真正的實驗。
舉(ju) 個(ge) 例子:想要研究司機聽不同音量的音樂(le) 和反應速度的關(guan) 係,可以通過讓同一個(ge) 司機聽兩(liang) 次不同大小音量的音樂(le) ,再測試反應速度進行對比。這時讓司機聽音樂(le) 的操作就是對他們(men) 進行的改變,也就是treatment。
是否有改變,直接影響了研究的類型,更重要的是影響了結果。觀察研究因為(wei) 無法確認誰導致誰,因此隻能得出正相關(guan) 與(yu) 負相關(guan) 。
如果研究結果是文化水平和收入呈正相關(guan) ,也無法判定是因為(wei) 文化水平高導致收入高,還是收入高所以有更好的教育資源,所以文化水平高。但是因為(wei) 實驗是進行了改變的,所以可以得到我們(men) 更希望的因果關(guan) 係結論。
實驗 Experiment
在AP統計考試中,研究比較多的是實驗,因此就涉及到了實驗的方法。 我們(men) 最簡單常見的方法就是完全隨機設計(Completely randomized design),將每一個(ge) 實驗對象都隨機分配至實驗組或對照組,最後把兩(liang) 組的數據進行對比。
通常實驗組是對實驗對象進行改變,而對照組則是不進行改變。但有時因為(wei) 實驗比較複雜,實驗組會(hui) 有好幾個(ge) ,那麽(me) 就要把實驗對象隨機分配到幾個(ge) 組中的一個(ge) ,再進行對比。
稍微複雜一點的實驗方法叫做隨機區組設計(Randomized block design)。先根據某個(ge) 標準把樣本分為(wei) 兩(liang) 組,再把每組的人分別隨機分到實驗組和對照組。
比如:研究人在不同商場中的消費金額,可以先把整體(ti) 樣本分為(wei) 男女兩(liang) 組,再把每個(ge) 男的隨機分到兩(liang) 個(ge) 不同的商場,女的也隨機分到兩(liang) 個(ge) 不同商場。這樣不僅(jin) 得到了兩(liang) 個(ge) 商場的不同消費數據,還能將男女數據進行對比。
最後一個(ge) ,也是最複雜的——配對實驗(Matched-pairs design)。最簡單的解釋是,實驗組與(yu) 對照組的數據可以因為(wei) 實驗對象的原因一一對應起來。 其中一種情況,是讓實驗對象每個(ge) 人做兩(liang) 件事。
就比如之前講到的讓司機聽兩(liang) 個(ge) 不同音量的音樂(le) ,測反應速度。或者測學生入學前成績和入學後成績,得出上課有沒有用的結論。
這種一人做兩(liang) 件事的實驗,是因一個(ge) 人給出的兩(liang) 個(ge) 數據一定是有聯係的,但又不能把A的第一個(ge) 數據和B的第二個(ge) 數據聯係起來,所以數據必須一一對應。 還有另一種情況,雖然不是同一個(ge) 人做的,但是實驗對象還是兩(liang) 兩(liang) 一對,得出的數據也是兩(liang) 兩(liang) 一對不能拆開,而且是matched-pairs的情況。比如研究情侶(lv) 的消費水平,雙胞胎誰會(hui) 更高等等。他們(men) 往往有個(ge) 不可分割的關(guan) 係,也使得他們(men) 的數據牢牢綁定在一起。
寫(xie) 在最後
抽樣檢測不僅(jin) 是統計中非常重要的一部分,在其它AP科目中往往也占據一席之地。因為(wei) 統計本身就是多個(ge) 學科的基礎,連題目都涵蓋了各個(ge) 領域。
AP統計作為(wei) 一門基礎學科,其難度在AP中並不能排上一二,若你感到難以應付,那你可能暫時還沒有找到攻破它的套路。
評論已經被關(guan) 閉。