Kaggle賽題解析:Benetech圖表內容識別

比賽名稱:Benetech - Making Graphs Accessible

使用 ML 從(cong) 圖形創建表格數據

比賽鏈接:https://www.kaggle.com/competitions/vesuvius-challenge-ink-detection

比賽類型:計算機視覺、圖文描述

比賽背景

數以百萬(wan) 計的學生有學習(xi) 、身體(ti) 或視力障礙,無法閱讀傳(chuan) 統印刷品。這些學生無法訪問科學、技術、工程和數學領域的大部分教育材料。存在使書(shu) 麵文字易於(yu) 訪問的技術。

比賽任務

本次比賽的目標是提取 STEM 教科書(shu) 中常見的四種圖表所代表的數據。您將開發一個(ge) 在圖形數據集上訓練的自動解決(jue) 方案。

  • Example - Vertical Bar

Kaggle賽題解析:Benetech圖表內(nei) 容識別

x,Alberta;Ontario;Quebec;P.E.I.,vertical_bar y,62023;50355;56288;38621,vertical_bar

  • Example - Horizontal Bar

Kaggle賽題解析:Benetech圖表內(nei) 容識別

x,299;289;279;229;211;209;173;159;128;113;95;53,horizontal_bar y,Dec;Nov;Oct;Sep;Aug;Jul;Jun;May;Apr;Mar;Feb;Jan,horizontal_bar

  • Example - Histogram

Kaggle賽題解析:Benetech圖表內(nei) 容識別

x,0;5;10;15;20;25,vertical_bar y,2.0;3.0;4.0;7.0;9.0,vertical_bar

  • Example - Categorical X-Axis

Kaggle賽題解析:Benetech圖表內(nei) 容識別

x,Guest 1561;Guest 1562;Guest 1563;Guest 1564;Guest 1565;Guest 1566,dot y,3;5;6;4;5;4,dot

  • Example - Line Graph

Kaggle賽題解析:Benetech圖表內(nei) 容識別

x,0;10;20;30;40;50;60;70,line y,2.85532;4.85973;7.02666;9.41515;11.72693;14.44788;16.70328;19.50852,line

評價(jia) 指標

預測由四種科學圖形(或圖表)表示的數據係列:條形圖、點圖、折線圖和散點圖。

使用Benetech Competition Metric評價(jia) :

https://www.kaggle.com/code/ryanholbrook/competition-metric-benetech-mixed-match

數據描述

本次比賽的數據集包括約65,000個(ge) 綜合注釋的科學圖形,分為(wei) 垂直條形圖、水平條形圖、點圖、折線圖和散點圖五種。

  • train/annotations/ 描述圖形的注釋
  • train/images/ JPG訓練數據
  • test/images/ 測試數據
  • sample_submission.csv 提交格式文件

比賽賽程

  • 2023年6月5日:組隊截止日期。
  • 2023年6月12日:最終提交截止日期。

賽題獎金

  • 第一名 - 15,000 美元
  • 第二名 - 10,000 美元
  • 第三名 - 8,000 美元
  • 第四名 - 7,000 美元
  • 第五名 - 5,000 美元
  • 第六名 - 5,000 美元

解題思路

賽題需要圖表內(nei) 容進行識別,並文字進行組織。因此賽題可以借助OCR和圖片描述的模型,是一個(ge) 複雜的視覺賽題。

【競賽報名/項目谘詢+微信:mollywei007】

上一篇

英國美國未來5年本科留學申請趨勢分析

下一篇

Edexcel愛德思Alevel考試詳細介紹

你也可能喜歡

  • 暫無相關文章!

評論已經被關(guan) 閉。

插入圖片
返回頂部