Kaggle成立於(yu) 2010年,是一個(ge) 進行數據發掘和預測競賽的在線平台。從(cong) 公司的角度來講,可以提供一些數據,進而提出一個(ge) 實際需要解決(jue) 的問題;從(cong) 參賽者的角度來講,他們(men) 將組隊參與(yu) 項目,針對其中一個(ge) 問題提出解決(jue) 方案,最終由公司選出的最佳方案可以獲得5K-10K美金的獎金。
除此之外,Kaggle官方每年還會(hui) 舉(ju) 辦一次大規模的競賽,獎金高達一百萬(wan) 美金,吸引了廣大的數據科學愛好者參與(yu) 其中。但是不同於(yu) 傳(chuan) 統的低層次勞動力需求,Kaggle一直致力於(yu) 解決(jue) 業(ye) 界難題,因此也創造了一種全新的勞動力市場——不再以學曆和工作經驗作為(wei) 唯一的人才評判標準,而是著眼於(yu) 個(ge) 人技能,為(wei) 頂尖人才和公司之間搭建了一座橋梁。
學員要求
建議學員對python有一定的基礎,同時具備微積分和概率的基礎知識
Kaggle競賽題目
部分題目展示:
1.Two Sigma: Using News to Predict Stock Movements(Use news analytics to predict stock price performance)
2.Jigsaw Unintended Bias in Toxicity Classification(Detect toxicity across a diverse range of conversations)
3.Santander Customer Transaction Prediction(Can you identify who will make a transaction?)
課程大綱
(授課內(nei) 容(可能根據學生接受程度在課程容量上有調整))
第一周-上午(2h)
1. 賽事入門講解
Kaggle賽事介紹,過往案例分析
2. 基礎培訓
Python基礎框架梳理、Machine Learning入門
第一周-下午(2h)
1. 基礎培訓
模型應用:Regression Methods、Perceptron、Logistic Regression、Neural Network
2. 比賽實戰
當期比賽題目分析、實踐
第二周-上午(2h)
1. 基礎培訓
模型應用:Regression Methods、Perceptron、Logistic Regression、Neural Network
第二周-下午(2h)
1. 比賽實戰
往期比賽題目調試、提交
評論已經被關(guan) 閉。