AI越來越牛留學生卻越來越慘?

近幾年,隨著科學技術的進步,人們(men) 發明了以ChatGPT為(wei) 代表的AI工具來幫助和服務人們(men) 。完成中等水平的論文等學生作業(ye) 對於(yu) AI工具來說是輕而易舉(ju) 的。

但是,從(cong) 教育的角度出發,依靠AI完成作業(ye) 對學生並沒有太多正向作用。學校主張學生自主完成作業(ye) ,美國部分大學已經明令禁止學生使用ChatGPT寫(xie) 作業(ye) ,並且還專(zhuan) 門又發明了一些AI工具來檢測是否為(wei) 機器生成。

這下,英語為(wei) 非母語的學生無故受冤了。比竇娥還冤!

一項有意思的研究

斯坦福大學的通過研究揭示了一個(ge) 現象:AI檢測工具在評估非英語母語者的寫(xie) 作時存在嚴(yan) 重的偏見和誤判。

這種偏見不僅(jin) 可能導致非母語者在學術、求職和教育領域受到不公正對待,還可能進一步加劇他們(men) 在這些領域中的邊緣化。

AI越來越牛,留學生卻越來越慘?

這個(ge) 研究的主導者是生物醫學數據科學助理教授 James Zou,他與(yu) 團隊用七種流行的GPT檢測程序修改了91篇非母語者的英文論文。結果是,有的號稱準確率99%的AI程序,卻會(hui) 將98%非母語者自己寫(xie) 的論文標記為(wei) 「由人工智能撰寫(xie) 」。而當學者將美國八年級學生的作文給同一個(ge) AI,它就正常地將90%作為(wei) 判定為(wei) 「由人類撰寫(xie) 」

AI越來越牛,留學生卻越來越慘?

圖表中的百分比表示「誤判」的比例。是由人寫(xie) 的,但檢測軟件認為(wei) 是AI生成的。

這時候不得不問出一句:憑什麽(me) ?

究其原因

AI語言檢測工具通常基於(yu) 複雜的算法和龐大的語料庫來判斷文本的來源。

它們(men) 通過分析文本的語言特征、詞匯使用、句子結構等因素,來判斷文本是否由人類或機器生成。然而,由於(yu) 非母語者在語言使用上與(yu) 母語者存在差異,這些差異往往成為(wei) AI誤判的“陷阱”。

具體(ti) 來說,AI語言檢測工具可能過於(yu) 依賴文本的複雜性作為(wei) 判斷標準。非母語者由於(yu) 語言水平有限,往往使用更簡單的詞匯和句式來表達思想。這種語言風格與(yu) 機器生成的文本相似,容易被AI誤判為(wei) AI文章。此外,一些AI工具還可能存在對特定語言或地區的偏見,導致對非母語者的誤判率更高。

AI越來越牛,留學生卻越來越慘?

被所有7個(ge) GPT誤判的托福作文在複雜度(Complexity)上明顯低於(yu) 其它論文。

總而言之,各種GPT檢測器好像還是沒能抓住AI生成和人類寫(xie) 作之間最本質的區別。

留學生又遭罪

在技術實現進一步發展前,作為(wei) 英語為(wei) 非母語的留學生就成了吃虧(kui) 群體(ti) 。

長此以往,非母語者不僅(jin) 可能會(hui) 因為(wei) 論文被誤判為(wei) 機器生成的內(nei) 容而失去發表的機會(hui) ,從(cong) 而影響他們(men) 的學術聲譽和職業(ye) 發展。而且在求職過程中,非母語者的簡曆和求職信也可能被AI檢測器錯誤地標記為(wei) 機器生成的內(nei) 容,從(cong) 而失去機會(hui) 。在教育領域,非母語者也可能會(hui) 因為(wei) 作文被誤判為(wei) 機器生成的內(nei) 容而受到不公正的評分,影響他們(men) 的學業(ye) 成績和未來發展。

但好在人們(men) 快速發現了這樣的bug,並且快速做出了反應。範德堡大學近期公布了一則正式聲明,指出將停用AI論文檢測工具Turnitin,原因是該軟件在檢測7.5萬(wan) 篇學生論文時,誤將約750篇論文錯誤地判定為(wei) 人工智能生成。

同時,對於(yu) 語言有挑戰的學生,繼續提高自身的表達和寫(xie) 作能力依舊是不容小覷的重要任務。

【競賽報名/項目谘詢+微信:mollywei007】

上一篇

A-Level 三大考試局發布秋季大考時間表!

下一篇

國際理科VS高考理科深度剖析兩大考試難度差異!

你也可能喜歡

  • 暫無相關文章!

評論已經被關(guan) 閉。

插入圖片
返回頂部