斯坦福AI項目套殼中國大模型被抓包,抄襲團隊致歉並承諾撤下相關模型

近日,斯坦福大學AI團隊主導的 Llama3-V 開源模型被證實套殼抄襲國內清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5一事,在網絡上引發熱議。

最初是網友發現嗎,一個斯坦福AI團隊的Llama3-V模型使用的模型結構和代碼與面壁智能不久前發佈的MiniCPM-Llama3-V2.5極爲相似,僅修改了部分變量名。Llama3-V也具有與MiniCPM-Llama3-V 2.5相同的分詞器,包括後者新定義的特殊符號。

隨後面壁智能團隊確認該模型確實涉嫌抄襲。

目前,斯坦福Llama3-V團隊的兩位作者Siddharth Sharma(森德哈斯·沙瑪)和 Aksh Garg(阿克沙·加格)在社交平臺上就這一學術不端行爲向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。

不過Aksh Garg(阿克沙·加格)稱另一名作者已經無法聯繫到,他還指出自己和Siddharth Sharma主要是負責模型推廣,聯繫不上的那位作者主要編寫代碼。

他在迴應中表示“我們(包括Siddharth Sharma)倆查看了最新的論文,以驗證這項工作的新穎性,但並未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。我們向作者道歉,並對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任,並已撤下Llama3-V,再次致歉。”

另外,斯坦福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行爲,並對MiniCPM這一中國開源模型表示讚揚。(第一財經)