八家新聞機構起訴OpenAI、微軟 指控其AI工具侵犯版權

財聯社5月1日訊(編輯 牛佔林)美東時間週二,美國八家新聞機構在紐約聯邦法院對OpenAI、微軟提起訴訟,指控這兩家公司在未經許可的情況下,使用了它們的新聞作品來訓練生成式人工智能(AI)。

據悉,這八家新聞機構分別爲《紐約每日新聞》、《芝加哥論壇報》、《奧蘭多哨兵報》、《水星報》、《丹佛郵報》、《先鋒新聞》等,它們均屬於一家叫做奧爾登全球資本公司的對衝基金。

這些新聞機構當天指控稱,微軟的Copilot和OpenAI的ChatGPT非法複製了數百萬篇文章來培訓AI模型。

訴狀還提到,某些時候微軟和OpenAI的AI會逐字或近乎逐字地複製受版權保護的新聞作品,但不提供這些作品的作者、標題、版權或使用條款信息。更可惡的是,ChatGPT還“僞造”了那些損害其聲譽的文章,比如《丹佛郵報》一篇宣揚吸菸可以治療哮喘的虛假文章。

這些新聞機構要求OpenAI和微軟賠償它們的損失,並停止進一步侵犯版權行爲。

OpenAI發言人週二表示,該公司在產品開發和設計過程中非常注重支持新聞機構。“儘管我們之前沒有意識到奧爾登公司的擔憂,但我們正在積極與世界各地的許多新聞機構建立建設性的合作伙伴關係和進行對話,以探索機會,討論任何問題,並提供解決方案。”

在此之前,《紐約時報》和另外三家新聞機構The Intercept、Raw Story和AlterNet也對微軟和OpenAI發起了類似的訴訟。

新聞行業的律師Steven Lieberman評論稱,OpenAI的巨大成功也要歸功於其他人的工作,它在未經許可或付款的情況下獲取了大量優質內容。

《紐約時報》本月揭露稱,OpenAI、谷歌、Meta等公司爲了獲取訓練語料,不惜修改政策條款、無視互聯網信息的使用規則,違法使用了“多個來源”的數據。

這一切的背後是,訓練大語言模型用的數據越多,表現就會越好,但現在科技公司使用數據的速度已經超過數據生產的速度,甚至已經耗盡了互聯網上所有可靠的英文文本資源。

版權合作

與此同時,科技公司也在與新聞機構達成合作協議。就在本週,英國《金融時報》(FT)宣佈與OpenAI達成協議,將授權後者使用其資料庫來訓練AI模型。

今年1月,OpenAI表示,其正與數十家出版商洽談文章授權協議。截至目前,除了FT外,OpenAI還和美國的美聯社、德國的施普林格、法國的《世界報》和西班牙的Prisa Media達成了協議。

OpenAI每年向一些媒體公司提供100萬至500萬美元的授權費用,這遠遠低於蘋果等其他公司的報價。

據報道,就在週二,谷歌同意每年向《華爾街日報》的母公司新聞集團支付500萬至600萬美元,用於開發新的AI相關內容和產品。