這幾年我連續完成了好幾輪數據科學的美研申請,在這個(ge) 專(zhuan) 業(ye) 的申請上有所收獲,這篇推文總結一下分享給大家。
一、數據科學是什麽(me)
維基百科定義(yi) :數據科學(Data Science)是一門利用數據學習(xi) 知識的學科,其目標是通過從(cong) 數據中提取出有價(jia) 值的部分來生產(chan) 數據產(chan) 品。它結合了諸多領域中的理論和技術,包括應用數學、統計、模式識別、機器學習(xi) 、數據可視化、數據倉(cang) 庫以及高性能計算。數據科學通過運用各種相關(guan) 的數據來幫助非專(zhuan) 業(ye) 人士理解問題。數據科學技術可以幫助我們(men) 如何正確的處理數據並協助我們(men) 在生物學、社會(hui) 科學、人類學等領域進行研究調研。此外,數據科學也對商業(ye) 競爭(zheng) 有極大的幫助。
數據科學是一門結合計算機科學+數理統計+具體(ti) 領域應用的交叉學科
這個(ge) 圖很直觀的表達了數據科學作為(wei) 一門交叉學科的知識結構組成,也符合了大部分項目的課程設置。數據科學是在數據基礎之上,運用計算機和數理統計的知識,在某一個(ge) 具體(ti) 領域(商業(ye) 、IT、醫療等)解決(jue) 具體(ti) 問題。
二、美研數據科學項目開設情況
目前已經在美研院校大範圍開設,我統計了一下,目前綜合排名前30的院校中有24所學校開設了26個(ge) 相關(guan) 項目,總體(ti) 選擇豐(feng) 富。數據科學項目多數開設在統計係下,也有開設在計算機係下,或者統計係和工程學院聯合授課。
數據科學最常見的學科名稱是Master in Data Science,也有部分學校命名為(wei) Master in Analytics,基本就這兩(liang) 類命名方式。
在學製上,所有數據科學項目都是1-2年完成,3個(ge) 學期畢業(ye) ,即秋季-春季-秋季這種學製安排最為(wei) 常見,多數項目畢業(ye) 要求為(wei) 30個(ge) 學分,修完10-12門課程畢業(ye) 。 基本隻提供秋季開學,隻有約翰霍普金斯等少數幾個(ge) 學校提供春季開學。
三、美研數據科學項目本科申請背景要求
總體(ti) 以數學、統計、工程、經濟學這幾類專(zhuan) 業(ye) 為(wei) 主,沒有絕對的本科專(zhuan) 業(ye) 要求,本科開設數據科學專(zhuan) 業(ye) 的學校數量相對沒有碩士多,以杜克大學2021級學生為(wei) 例:工程類背景占比34%;經濟學占比24%;自然科學類占比10%。同時也可參考西北的MS in Aalytics項目的學生背景如下圖:
西北大學這個(ge) 項目對於(yu) 純數理背景的申請者偏好明顯更高。
對於(yu) 申請先修課程有嚴(yan) 格要求,最常見的要求為(wei) :
- 兩個學期的微積分課程,對應美本Calculus I & II,要求掌握多元微積分(Multivariable Calculus)
- 線性代數(Linear Algebra)
- 統計與概率論(Probability and Statistics)
- 編程語言(Computer Programming Language),以Python和R最為常見
以上四門課程最為(wei) 常見,個(ge) 別項目還有其他高階要求,比如微分方程、隨機過程、SPSS/STATA等。
對於(yu) 不能在自己本科院校完成相關(guan) 課程要求的學生,多數學校都表示可以通過社區大學或者線上課程(Coursera,Edx)的方式來滿足要求,其中喬(qiao) 治城大學給出了很詳細的參考如下:https://analytics.georgetown.edu/admissions/requirements/
四、數據課程項目申請材料
各個(ge) 項目申請材料比較類似,總結如下:
1. 成績單。這個(ge) 最為(wei) 重要,申請前30的項目總體(ti) 建議不能低於(yu) 3.5/4,競爭(zheng) 激烈的項目不低於(yu) 3.7,個(ge) 別學校比如範德堡需要提前做WES評估。
2. 托福。申請前30項目必須要考到100+,大部分項目托福要求100,哥倫(lun) 比亞(ya) 大學公布過2017級平均托福錄取分為(wei) 106.5,斯坦福公布過錄取平均托福分數在110左右。
3. GRE。這兩(liang) 年因為(wei) 疫情,大部分的項目對於(yu) GRE要求為(wei) 可選,建議目標分數325+,NYU公布的平均錄取GRE各部分平均分數:159.3(閱讀)+167.4(數學)+4.14(寫(xie) 作)。
4. 個(ge) 人陳述。我舉(ju) 例賓大對於(yu) 個(ge) 人陳述內(nei) 容的要求如下:
To help us better determine your candidacy for admission into the Data Science Program, your personal statement should clearly discuss your background while placing special emphasis on your coursework and/or your professional experience relevant to the Data Science Program. It should further elaborate your future plans and how they make you an ideal fit for the program.
主要討論三部分內(nei) 容:一是過往在數據科學方麵的課程和經曆,二是對於(yu) 該項目的理解和認識,三是對於(yu) 未來的規劃。
5. 三封推薦信
6. 簡曆
7. 先修課程要求
五、數據科學項目的主要開設課程
數據科學項目都會(hui) 以核心合成+選修課程兩(liang) 部分組成,以哥倫(lun) 比亞(ya) 大學為(wei) 例,核心課程包括以下七門:
1. Computer Systems for Data Science/數據科學中的計算機係統
2. Machine Learning for Data Science/數據科學中的機器學習(xi)
3. Algorithms for Data Science/數據科學中的算法
4. Probability and Statistics for Data Science/數據科學中的統計與(yu) 概率論
5. Exploratory Data Analysis and Visualization/探索性數據分析和可視化
6. Statistical Inteference and Modeling/統計推理與(yu) 建模
7. Data Science Capstone and Ethics/數據科學大作業(ye)
除了以上七門核心課程,哥大還要求學生完成三門選修課程,一共十門課程畢業(ye) ,這也是數據科學項目常見的課程開設模式,大家上的主體(ti) 課程內(nei) 容相近,差別不大。
也有少部分學校比如紐約大學和喬(qiao) 治亞(ya) 理工大學,將培養(yang) 計劃還分成了不同方向,也就是大家在相同的核心課程之上,通過不同方向的集中選修確立了自己的方向/Track,紐約大學的數據科學項目分為(wei) 了三個(ge) Track:Data Science Track/數據科學,Data Science Biology Track/生物數據科學,Biomedical Informatics Track/生物醫學信息學。喬(qiao) 治亞(ya) 理工的分析學項目也分為(wei) 了三個(ge) Track:Analytical Tools track/分析工具,Business Analytics/商業(ye) 分析,Computational Data Analytics/計算數據。
六、數據科學項目畢業(ye) 就業(ye) 情況
數據科學總體(ti) 就業(ye) 情況還不錯,市場需求比較大。常見的就業(ye) 職位包括:數據分析師,數據工程師等。以紐約大學的就業(ye) 報告舉(ju) 例如下:
70.18%的畢業(ye) 生在畢業(ye) 時已找到全職工作,主要去向三個(ge) 行業(ye) :技術科技類公司(51.61%),金融行業(ye) (22.58%),生物技術和健康產(chan) 業(ye) (6.45%)。2021屆畢業(ye) 生年薪範疇為(wei) 110,000-125,000美金。
詳細就業(ye) 報告可參考鏈接:https://cds.nyu.edu/placement-stats/
七、數據科學與(yu) 分析學的聯係和區別
雖然我把數據科學(Data Science)和分析學(Analytics)在這篇推文中合並在一起總結介紹,但這兩(liang) 個(ge) 專(zhuan) 業(ye) 在側(ce) 重點上還是有一些區別。
數據科學側(ce) 重於(yu) 數據的存儲(chu) 、恢複、清理、挖掘、可視化、分析等處理內(nei) 容,創造和運用算法在原始數據基礎上來理解數據的意義(yi) 。分析學是通過已處理的數據,來尋找規律回答問題,在數據基礎上提供決(jue) 策分析。打個(ge) 比方,數據科學像是種地收獲糧食,分析學像是把生米煮成熟飯。
八、美國綜合TOP30大學數據科學項目匯總及申請難度評估
表格說明:
1. 招生數量一列中,能列出的為(wei) 學校公布的準確數據,「/」表示沒有公布數據。
2. GRE一列中,「不需要」表示申請審核中不參考GRE成績;「optional」表示可選擇是否提交;具體(ti) 的數據如「168+170+4.5」表示學校公布的GRE閱讀、數學、寫(xie) 作三部分的平均分數。所列的GRE要求隻適用於(yu) 2021-2022申請季,未來可能出現要求變化。
3. 申請難度一列中,「一檔」、「二檔」、「三檔」為(wei) 具體(ti) 申請數據外加主觀經驗判斷的申請難度分檔。
九、數據科學和計算機科學在IT行業(ye) 的崗位區別
因為(wei) 我家裏人剛好有人在互聯網行業(ye) 從(cong) 事數據分析的工作,TA本來是學計算機出身,先做的開發崗位,也就是傳(chuan) 統意義(yi) 上的碼農(nong) ,然後轉做了數據,我也請教了一些TA,總結下來幾點行業(ye) 經驗。
1. CS的行業(ye) 起點相對低,但是職業(ye) 路線比較廣,上限下限相差巨大,涉及到開發性的工作都可以去嚐試。目前本科cs出來大部分做的還是基礎性研發工作,在工作技能上比較注重Java或者其他開發性語言這塊的能力。工作比較辛苦,加班比較多。
2. Data Science更重視的是數據思維能力,需要有一定的開發基礎。畢業(ye) 生基本上從(cong) 事的是數據相關(guan) 的工作,比如數據分析,數據產(chan) 品,大數據相關(guan) 的開發或者算法之類更高級的數據崗位,綜合能力要求更高一些,行業(ye) 能夠提供的崗位數量相對少,基本都需要研究生背景才能進大廠。數據崗位的技能要求不是單一的,根據具體(ti) 崗位和業(ye) 務性質,來判斷人員偏重哪個(ge) 方向,需要更高的邏輯思維能力,和基礎的開發能力。
十、其他
我之前的申請經驗裏,還總結出一個(ge) 很受用的經驗,即背景不夠強勢可以直接申請CS的學生,以及對理科不排斥的文科生,都可以從(cong) 就業(ye) 的角度考慮來準備數據科學的申請。
數據科學最重要的四門前期課程:微積分I & II,線性代數,概率統計,編程語言,對於(yu) 大部分學生,隻要你想要去準備都還是有機會(hui) 能學到的,甚至在完成了這幾門課程之後,也能順便加強對商業(ye) 分析、金融等商科領域的申請背景,大範圍開拓了自己的申請選擇。 另外就是上文提到的數據類崗位招聘學曆要求更高的現狀,這是數據科學的學生必須麵對的問題,讀一個(ge) 數據科學碩士幾乎變成了入行要求。
今年我明顯感受到美研的申請數量在增加,申請難度在變大。原因很簡單,國內(nei) 經濟下行就業(ye) 崗位不足,國內(nei) 有更多的本科生在準備考研或者出國,就業(ye) 問題也在影響美本學生,他們(men) 的主要就業(ye) 方向也是國內(nei) ,我估計至少有七成的美本學生也在申請美研,大家就隻能湊在一起可勁卷了。
評論已經被關(guan) 閉。