比賽名稱:Predict Student Performance from Game Play
從(cong) Jo Wilder 在線教育遊戲中追蹤學生的學習(xi) 情況
比賽鏈接:https://www.kaggle.com/competitions/predict-student-performance-from-game-play
比賽類型:數據挖掘、知識跟蹤
比賽背景
學習(xi) 本應是有趣的,這就是基於(yu) 遊戲的學習(xi) 的用武之地。這種教育方法允許學生在遊戲框架內(nei) 參與(yu) 教育內(nei) 容,使其充滿樂(le) 趣和活力。
盡管基於(yu) 遊戲的學習(xi) 正在越來越多的教育環境中使用,但仍有有限數量的開放數據集可用於(yu) 應用數據科學和學習(xi) 分析原理來改進基於(yu) 遊戲的學習(xi) 。
大多數基於(yu) 遊戲的學習(xi) 平台都沒有充分利用知識追蹤來支持個(ge) 別學生。知識追蹤方法是在在線學習(xi) 環境和智能輔導係統的背景下開發和研究的。但教育遊戲中對知識追蹤的關(guan) 注較少。
競賽主辦方 Field Day Lab 是威斯康星州教育研究中心的公共資助研究實驗室。他們(men) 為(wei) 許多學科和年齡組設計遊戲,將當代研究帶給公眾(zhong) ,利用遊戲數據來了解人們(men) 的學習(xi) 方式。
比賽任務
比賽的目的是實時預測學生在基於(yu) 遊戲的學習(xi) 過程中的表現。選手需要開發一個(ge) 在遊戲日誌上訓練的模型。
這次比賽將有助於(yu) 推進對基於(yu) 遊戲的學習(xi) 的知識追蹤方法的研究。這次比賽將支持教育遊戲的開發者為(wei) 學生創造更有效的學習(xi) 體(ti) 驗。
評價指標
提交的內(nei) 容將根據其 F1 分數進行評估。
對於(yu) 測試集中的每個(ge) session_id / 問題編號對,您必須預測正確變量的二進製標簽。
數據描述
測試集API
本次比賽使用了Kaggle的時間序列API,測試數據將以不允許訪問未來數據的分組形式提供。
本次比賽的目的是使用在線教育遊戲生成的時間序列數據來判斷玩家是否會(hui) 正確回答問題。共有三個(ge) 問題檢查點,每個(ge) 問題都有一些問題。在每個(ge) 檢查點,選手都可以訪問該部分之前的所有測試數據。
文件說明
- train.csv - 訓練集
- test.csv - 測試集
- sample_submission.csv - 格式正確的樣本提交文件
- train_labels.csv - 訓練集中每個會話的所有 18 個問題的正確值
列名含義
- session_id - 事件發生的會話 ID
- index - 會話事件的索引
- elapsed_time - 從會話開始到記錄事件之間經過了多長時間(以毫秒為單位)
- event_name - 事件類型的名稱
- name - 事件名稱(例如,標識 notebook_click 是打開還是關閉筆記本)
- level - 事件發生在遊戲的哪個級別(0 到 22)
- page - 事件的頁碼(僅適用於與筆記本相關的事件)
- room_coor_x - 遊戲內房間的點擊坐標(僅適用於點擊事件)
- room_coor_y - 遊戲內房間的點擊坐標(僅適用於點擊事件)
- screen_coor_x - 相對於玩家屏幕的點擊坐標(僅適用於點擊事件)
- screen_coor_y - 相對於玩家屏幕的點擊坐標(僅適用於點擊事件)
- hover_duration - 懸停發生的時間(以毫秒為單位)(僅適用於懸停事件)
- text - 玩家在此事件中看到的文本
- fqid - 事件的完全限定 ID
- room_fqid - 發生事件的房間的完全限定 ID
- text_fqid - 的完全限定 ID
- fullscreen - 播放器是否處於全屏模式
- hq - 遊戲是否是高質量的
- music - 遊戲音樂是打開還是關閉
- level_group - 哪組級別 - 和哪組問題 - 此行屬於 (0-4, 5-12, 13-22)
比賽賽程
- 2023年5月1日:組隊截止日期。
- 2023年5月8日:最終提交截止日期。
賽題獎金
- 第一名:12,000 美元
- 第二名:8,000 美元
- 第三名:5,000 美元
- 第四名:5,000 美元
解題思路
賽題是一個(ge) 典型的表格類型的數據挖掘賽題,但屬於(yu) 知識跟蹤領域。考慮到比賽數據集字段,擁有如下特點:
- 需要考慮學生的自身知識
- 需要考慮問題的難度
- 需要考慮問題的內容
- 需要考慮學生的學習過程
按照曆史比賽的經驗,本次比賽可以使用深度學習(xi) 模型,也可以使用樹模型。如果使用深度學習(xi) 模型,則是基於(yu) Transformer的序列建模。
評論已經被關(guan) 閉。