ChatGPT搜索引擎要來了,但它面臨的麻煩還不少

新晉人工智能霸主OpenAI開始挑戰搜索市場格局。

OpenAI很可能推出基於ChatGPT技術的新搜索引擎。5月6日,界面新聞注意到,名爲“GPT Search”的網頁已經上線,但目前只有會員才能訪問。

上述消息最早是創業孵化器Y Combinator中的一篇帖子透露的,文中稱“search.chatgpt.com”的域名和安全證書已經創建。知名記者Pete Huang也發推特預告,表示GPT Search將在5月9日正式上線。

OpenAI如何提供更個性化的深度集成搜索體驗,以及帶來怎樣的人與信息的交互方式變革備受外界期待。自從ChatGPT誕生,科技圈都在等待着一場OpenAI與谷歌在搜索市場的正面對決。已經有大量用戶通過微軟的Bing Chat、谷歌的Gemini等聊天機器人,獲得人工智能生成檢索答案。

目前,OpenAI估值超800億美元,微軟已向該公司投入130億美元。OpenAI在搜索市場上顯得“野心勃勃”。

“將LLM(大型語言模型)與搜索進行深度集成,ChatGPT可能是搜索的未來。”今年4月,OpenAI首席執行官Sam Altman已經向人們昭示了該公司的宏大野心。

這家手握微軟130億美元投資的公司,目前估值超800億美元。無論在技術還是資金上,它已然成爲能夠威脅到谷歌搜索地位的新勢力。

事實上,OpenAI已經在藉助微軟之力不斷向搜索引擎逼近。去年5月,微軟在其“2023 Build開發者大會”上宣佈,Bing搜索將很快直接集成到OpenAI的ChatGPT聊天機器人中,從而在Bing上內置部分實時搜索功能。

微軟還表示,ChatGPT將內置一個世界級的搜索引擎,以提供更及時、更新的答案,並從網頁上獲取信息。

彼時,微軟公司CEO、董事長薩提亞·納德拉曾樂觀地表示,“整個搜索類別正在經歷翻天覆地的變化,這樣的機會很少出現。”

更有樂觀者認爲,此舉或將成爲人工智能的“iPhone時刻”,有望削弱或顛覆谷歌在搜索市場的主導地位。

到了去年10月,微軟Bing將OpenAI最新版本的圖像生成模型DALL-E3納入其中,幫助訪問者生成逼真的圖像,從而提升用戶使用頻率。

微軟公司副總裁兼Copilot和Bing工程與產品負責人Jordi Ribas稱,“DALL-E3加入後,必應使用量增加了10倍,這確實對產品的參與度和用戶產生了影響。”

彭博社分析稱,2023年第二季度,美國Bing月度活躍用戶同比增長一倍以上,達到310萬,用戶在搜索引擎上花費的時間增加了84%。SensorTower的數據則顯示,到年底,Bing的月活躍用戶已穩步增長至440萬。

然而要談Bing挑戰谷歌的霸主地位還爲時尚早。StatCounter數據顯示,截至2023年底,微軟Bing僅佔全球搜索市場的3.4%,自宣佈集成ChatGPT以來,其市場份額上升了不到1個百分點,而谷歌仍然佔據全球90%的搜索市場總量。

對搜索而言,數據是決定搜索質量的關鍵因素,即搜索次數越多,搜索答案越精準。

生成式人工智能將如何改變搜索及排名結果,也將對谷歌頗爲依賴的廣告模式產生影響。過去,搜索廣告主要依靠點擊次數盈利,導致大量劣質廣告信息前置,用戶體驗極差。在中國,類似的情況同樣存在。

“如果我們能夠建立一個比谷歌更好的搜索引擎,那就應該這樣做。”Sam Altman指出:“谷歌向你展示了13個廣告和10個藍色鏈接,也許有更好的方法來幫助人們搜索信息,並根據提示採取行動。”

但要拿下搜索市場,還需要硬件公司和內容數據方的深度配合。眼下,OpenAI仍爲搜索數據所困。

就在4月30日,奧爾登全球資本旗下的八家日報起訴OpenAI和微軟,指控兩家公司非法使用新聞文章爲其人工智能聊天機器人提供動力。

這些公司在訴狀中稱,OpenAI和微軟在未經許可的情況下使用數百萬篇受版權保護的文章來訓練和餵養他們的生成式人工智能產品,包括ChatGPT和Microsoft Copilot。該訴訟沒有要求具體的金錢賠償,但要求陪審團審判,並表示出版商因使用內容而應獲得賠償。

“我們花費了數十億美元在出版物上收集信息和報道新聞,我們不能允許OpenAI和微軟擴大竊取我們工作成果,以犧牲我們的利益爲代價建立自己的業務。”奧爾登報紙的執行主編Frank Pine在一份聲明中說。

OpenAI發言人則迴應稱,公司此前並不瞭解奧爾登的擔憂,但正在與許多新聞機構建立合作伙伴關係並進行對話,以探索合作機會。當地時間5月6日,英國《金融時報》宣佈已與OpenAI達成內容許可協議,後者能夠利用其數據庫來訓練GenAI模型。

與此同時,不少作家也開始行動,包括瑪格麗特·阿特伍德、丹·布朗和喬迪·皮考特在內的8500多名作者,聯合敦促ChatGPT和Bard等負責生成人工智能應用的科技公司,在未經適當授權的情況下停止使用他們的作品或提供補償。

《紐約時報》最近的一項調查發現,許多科技公司在努力跟上人工智能步伐的過程中忽視了相關政策,並討論規避版權法,以獲取儘可能多的數據來訓練聊天機器人。國內的大模型同樣無法避免這一問題,各類大模型產品的參考答案多來自於媒體報道或已有的數據。

生成式人工智能從根本上改變搜索市場,距離這一天也許不會太遙遠。但在此之前,這些AI公司需要首先解決好數據來源以及版權爭議等問題。