比賽名稱:Learning Equality - Curriculum Recommendations
通過將 K-12 內(nei) 容與(yu) 目標主題進行匹配
比賽鏈接:https://www.kaggle.com/competitions/learning-equality-curriculum-recommendations
比賽類型:內(nei) 容聚類、細粒度分類
比賽背景
比賽的目標是將教育內(nei) 容與(yu) 課程中的特定主題相匹配的過程。選手將開發一個(ge) 準確高效的模型,該模型在 K-12 教育材料庫上進行訓練,這些材料已被組織成各種主題分類法。
目前將數字材料與(yu) 國家課程相結合的努力是手動的,需要時間、資源和課程專(zhuan) 業(ye) 知識,並且需要提高該過程的效率以實現可擴展性和可持續性。
比賽任務
您麵臨(lin) 的挑戰是預測內(nei) 容與(yu) 主題的匹配,以減少用戶搜索和發現相關(guan) 內(nei) 容時間。
評價指標
提交的內(nei) 容將根據他們(men) 的平均 F2 分數進行評估。均值是以樣本方式計算的,這意味著 F2 分數是為(wei) 每個(ge) 預測行計算的,然後取平均值。
數據描述
訓練集包括來自 Kolibri 內(nei) 容庫中的主題樹語料庫,以及額外的非公開對齊頻道,以及具有較少粒度或較低質量對齊的補充頻道。
- topics.csv包含數據集中每個主題的一行。主題被組織成“頻道”,每個頻道包含一個“主題樹”。
- content.csv包含數據集中每個內容項的一行。
- correlations.csv與訓練集中的主題關聯的內容項。單個內容項可能與多個主題相關聯。在每一行中給出一個 topic_id 和所有關聯的 content_id 的列表。
比賽賽程
- 2023年3月7日:組隊截止日期。
- 2023年3月14日:最終提交截止日期。
賽題獎金
排行榜獎品
- 第一名 - 12,000 美元
- 第二名 - 8,000 美元
- 第三名 - 5,000 美元
- 第四名 - 5,000 美元
效率獎
- 第一名 - 12,000 美元
- 第二名 - 8,000 美元
- 第三名 - 5,000 美元
解題思路
賽題是一個(ge) 非常規的賽題,由主題和內(nei) 容兩(liang) 個(ge) 部分組成。主題和內(nei) 容分別提供了額外的信息字段,因此我們(men) 需要將主題和內(nei) 容進行匹配。
可以考慮從(cong) 如下角度進行解題:
- 將主題和內容嵌入,然後計算相似度。
- 將主題和內容匹配抽象為二分類。
- 從圖的角度進行匹配主題和內容。
評論已經被關(guan) 閉。