OpenAI正在與數十家出版商談合作 可開價被曝太小氣

財聯社1月5日訊(編輯 劉蕊)隨着OpenAI的生成式人工智能工具ChatGPT熱度持續,關於該工具訓練材料來源的知識產權問題也面臨更多關注。

美東時間週四,OpenAI表示,它正在與數十家出版商談判,以獲得他們的文章授權。

OpenAI正與數十家出版商談判

此前早有傳聞稱,OpenAI正在與多家出版商談判,尋求海量內容授權來訓練其人工智能模型,不過這一次公佈的談判對象數量,比之前外界所知的更多的多。

“我們正在與許多發行商進行許多談判和討論。他們很活躍,也非常積極。談判進展得很順利,”OpenAI的知識產權和內容主管湯姆·魯賓( Tom Rubin)表示,“你已經看到了我們公開的部分交易,未來還會有更多。”

上個月,OpenAI剛剛與Politico的母公司Axel Springer SE簽署了一項爲期多年的許可協議,價值數千萬美元。去年7月,OpenAI宣佈與美聯社達成一項協議,但未透露協議金額。

這些知識產權交易對OpenAI的未來至關重要,因爲它正在平衡對構建模型所需的更新、準確數據的需求,以及對數據來源的日益嚴格的審查。

不過據外媒報道,最近與OpenAI進行談判的兩名媒體公司高管表示,OpenAI僅僅願意向部分媒體公司提供每年100萬至500萬美元的授權費用。即使對小型出版商來說,這也是一個很小的數字,可能會讓OpenAI很難達成協議。

相比之下,最近試圖在生成式人工智能領域趕上OpenAI的蘋果,也在試圖與出版商達成協議,以使用它們的內容。而且,蘋果給出的資金條件要豐厚的多。

OpenAI正苦陷在與《紐約時報》的官司裡

就在上週,與OpenAI進行過談判的公司之一——《紐約時報》就對OpenAI和微軟公司發起了起訴,指控他們在未經許可的情況下,使用該媒體的文章。

這起訴訟對OpenAI的業務構成了生死存亡的挑戰。如果《紐約時報》勝訴,OpenAI不僅可能欠下數十億美元,還可能需要被迫銷燬其所有訓練數據,這將意味着巨大的複雜工作量和高昂的金錢成本。而且,更直接的是,這起訴訟使OpenAI與媒體行業達成交易的努力複雜化。

魯賓表示:“目前的情況與出版商過去在搜索引擎和社交媒體上面臨的情況大不相同……在這裡,內容是用來訓練模型的。它不是用來複制內容的。它不是用來取代內容的。”

然而,《紐約時報》並不同意OpenAI的說辭,認爲ChatGPT完全是在不付費的情況下抄襲其記者的作品。

在訴訟中,《紐約時報》出版商展示了ChatGPT幾乎一字不差地從《紐約時報》上摘錄整段文字的例子——儘管也有些人指出,在某些出版商舉的例子中,它使用了特別的手段,誘使ChatGPT更可能複製《紐約時報》的內容。出版商認爲,這證明OpenAI使用了《紐約時報》的數據。

《紐約時報》在一份聲明中表示:“如果微軟和OpenAI想將我們的成果用於商業目的,法律要求他們首先獲得我們的許可……但他們沒有這麼做。”