比賽名稱:GoDaddy - Microbusiness Density Forecasting
預測下個(ge) 月的微型企業(ye) 密度
比賽鏈接:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting
比賽類型:結構化回歸任務
比賽背景
美國的政策領導人努力發展更具包容性和抵禦衰退的經濟體(ti) 。他們(men) 還意識到,隨著技術的進步,創業(ye) 精神從(cong) 未像今天這樣容易獲得。無論是為(wei) 了創造更合適的工作/生活平衡、追隨激情,還是由於(yu) 失業(ye) ,研究表明,美國人越來越多地選擇創建自己的企業(ye) 來實現其財務目標。
挑戰在於(yu) ,這些“微型企業(ye) ”通常太小或太新,無法出現在傳(chuan) 統的經濟數據來源中,這使得決(jue) 策者幾乎不可能研究它們(men) 。但數據科學可以幫助填補空白,並提供對與(yu) 這些業(ye) 務相關(guan) 的因素的見解。
大賽主辦方GoDaddy是全球最大的麵向全球創業(ye) 者的服務平台。他們(men) 的使命是通過為(wei) 他們(men) 提供在線發展所需的所有幫助和工具,為(wei) 他們(men) 的全球 20 多萬(wan) 客戶和世界各地的企業(ye) 家社區賦能。
比賽任務
本次比賽的目標是預測給定地區每月的微型企業(ye) 密度。您將開發一個(ge) 根據美國縣級數據訓練的準確模型。
您的工作將幫助政策製定者了解微型企業(ye) ,這是一種非常小的實體(ti) 的增長趨勢。更多信息將使新的政策和計劃能夠提高這些最小企業(ye) 的成功和影響。
評價指標
提交的內(nei) 容在 SMAPE 上根據預測值和實際值進行評估。當實際值和預測值都為(wei) 0 時,我們(men) 定義(yi) SMAPE = 0。
數據描述
您在本次比賽中的挑戰是預測美國各地的微型企業(ye) 活動,以美國各縣微型企業(ye) 的密度來衡量。微型企業(ye) 通常太小或太新,無法出現在傳(chuan) 統經濟數據源中,但微型企業(ye) 活動可能與(yu) 其他普遍感興(xing) 趣的經濟指標相關(guan) 。
由於(yu) 曆史經濟數據隨處可見,因此這是一場預測競賽。預測階段的公共排行榜和最終的私人排行榜將使用提交期結束後收集的數據來確定。您將進行靜態預測,這些預測隻能包含提交期結束前可用的信息。
關(guan) 於(yu) 縣的大量數據是公開的,我們(men) 沒有試圖在這裏收集所有數據。強烈建議您為(wei) 功能使用外部數據源。
- train.csv:訓練集
- test.csv:測試集
- revealed_test.csv:公開排行榜隻會使用最近一個月的數據,任何早於該數據的測試集數據都將發布在 revealed_test.csv
- census_starter.csv:國人口普查局美國社區調查數據
比賽賽程
- 2023年3月7日:組隊截止日期。
- 2023年3月14日:最終提交截止日期。
賽題獎金
- 一等獎:20,000 美元
- 二等獎:15,000 美元
- 三等獎:10,000 美元
- 四等獎:5,000 美元
- 五等獎:5,000 美元
- 六等獎:5,000 美元
解題思路
賽題是一個(ge) 典型的結構化回歸任務,且數據集非常小的,估計是未來非常熱門的比賽。
賽題需要按照地區、年份對小維企業(ye) 密度進行預測,因此賽題是非常容易過擬合的,因此建議使用簡單的模型。
此外賽題是鼓勵外部數據集,因此可以考慮使用外部數據。當然也需要預測經濟未來的發展:
- 地圖數據,經緯度信息
- 外部經濟指標,宏觀經濟
- 人口流量信息
評論已經被關(guan) 閉。