1. 程式人生 > 資訊 >百人聯名 AI 大模型綜述論文被指抄襲,智源研究院致歉:承認存在問題,立即刪除修訂

百人聯名 AI 大模型綜述論文被指抄襲,智源研究院致歉:承認存在問題,立即刪除修訂

一篇 19 家機構、100 位學者聯名發表的 AI 大模型綜述論文,被指涉嫌大量段落抄襲。

此事已在國內外學術圈引起廣泛關注。事件爆出當日晚,論文第一單位智源研究院發表中英文致歉信。承認文章中存在問題,已啟動第三方獨立審查,後續將進行追責。

根據智源研究院宣告,這篇綜述報告由智源牽頭,邀請國內外 100 位科研人員分別撰寫了 16 篇獨立的專題文章,並單獨署名。

按初步調查結果,智源決定立即從文章中刪除已確認的抄襲內容,並通知所有作者對所有內容進行全面審查。目前論文修訂版已提交 arXiv 進行更新。

事件經過

問題最早由谷歌大腦研究員 Nicholas Carlini 指出。他在一篇部落格文章中列舉了 10 個涉嫌抄襲的段落,文字一致的部分用綠色標出。

同時通過收集資料初步核查,Carlini 發現這篇論文還涉嫌抄襲十餘篇來自其他作者的論文。此事在社交媒體上不斷髮酵,引發大量關注。

隨後 Carlini 更新了一段話,呼籲大家理性看待,不要演變成獵巫行動。在不清楚 100 個作者中的具體責任人之前不要一棍子打死。

不過,ViT 作者之一 Lucas Beyer 認為,在論文中署名就意味著要參與從創意腦暴、試驗、撰寫、校對的過程,承擔相應責任。

被抄襲的作者之一、谷歌大腦研究員 Katherine Lee 給出建議:如果需要複用文字,請使用引號明確你的意圖,並註明來源。

對於複用文字,Carlini 認為這是一篇綜述文章,並不算把別人成果說成自己的那種最惡劣的抄襲。但綜述文章的意義在於對一個研究領域的重新構建,直接複製之前的論文並不能帶來新的價值。

最後,附上智源研究院致歉信中文版全文。

智源研究院致歉信:

https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html

Nicholas Carlini 部落格文章:

https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html