披薩加膠水成笑話,數據顯示谷歌再次之前就已減少AI概述顯示

6月5日消息,谷歌搜索最近推出的“人工智能概述”功能,因其令人啼笑皆非的荒謬答案而引發關注。第三方公司的追蹤數據顯示,早在該功能引起廣泛關注之前,谷歌就已開始降低其顯示頻率。

近幾周來,凡是稍微關注互聯網的人都可能注意到,谷歌對其搜索引擎的人工智能全面升級開局並不順利。谷歌推出的“人工智能概述”(AI Overviews)功能旨在爲搜索查詢提供人工智能生成的簡要答案,但該功能自上線幾天後便因生成錯誤甚至荒謬的答案而備受嘲笑,例如建議用戶在披薩中添加膠水,或每天至少食用一塊小石頭。

搜索引擎優化公司BrightEdge的最新數據顯示,谷歌自推出“人工智能概述”功能以來,已顯著減少其在搜索結果中的展示頻率,並且在廣泛批評出現之前,就已開始大幅限制這一功能的應用。自去年測試版推出以來,BrightEdge便開始追蹤“人工智能概述”在數萬個搜索結果中的出現情況。

5月14日谷歌I/O開發者大會後,“人工智能概述”在美國的英文用戶中上線。BrightEdge追蹤到的數據顯示,人工智能生成的答案只佔不到27%。但在“人工智能概述”的錯誤截圖在網絡上瘋傳的前一週,其出現頻率便急劇下降。到上週末,當谷歌通過博客帖子承認人工智能功能的失誤時,BrightEdge觀察到“人工智能概述”僅出現在11%的搜索結果頁面上。到了本週一,出現頻率基本與上週末持平。

BrightEdge的創始人兼執行主席Jim Yu表示,顯示頻率的下降表明谷歌決定採取更爲謹慎的措施。“顯然,他們在努力嚴格控制相關風險。”他補充說,儘管目前存在問題,但他對谷歌處理“人工智能概述”的方式持樂觀態度,認爲這些初期問題僅是暫時的小波折,而非系統性的問題。

谷歌發言人內德·阿德里安斯(Ned Adriance)表示:“我們正在持續優化‘人工智能概述’的展示時間和方式,以確保其儘可能有用,包括在過去一週內進行了多項技術更新以提升響應質量。” 谷歌拒絕公開“人工智能概述”在搜索中出現頻率的內部統計數據,但阿德里安斯表示,BrightEdge的數據並不反映公司內部觀測到的情況。

至於谷歌在功能上線不久後爲何決定大幅減少其顯示頻率,尚不得而知。但公司在上週的博客帖子中承認,數百萬用戶使用該功能後,爲公司提供了關於其性能和錯誤的新數據。谷歌搜索業務負責人利茲·裡德(Liz Reid)表示,谷歌已進行了“十幾項技術改進”,例如限制搜索結果中出現諷刺性內容。她的帖子提到,這些更改將觸發對“人工智能概述”的顯示時機的新限制,但沒有具體說明這些限制將如何改變人工智能結果顯示的頻率。

去年末,當谷歌允許用戶選擇加入“人工智能概述”功能的測試版時,BrightEdge便開始利用樣本查詢列表來跟蹤該功能的表現。這些測試查詢覆蓋了九個領域,包括電子商務、保險和教育,旨在涵蓋常見及較少見的搜索類型。這些查詢被一遍又一遍地測試,有時一天多次。

2023年12月,BrightEdge發現84%的搜索結果中出現了“人工智能概述”。然而,隨着時間推移,這一比例開始下降。谷歌的阿德里安斯表示,這並不意味着84%的搜索自動觸發了人工智能概述,但他未對公司的內部測量進行詳細說明。在谷歌向所有用戶開放“人工智能概述”後,BrightEdge繼續追蹤那些已參與測試版和未參與過測試版的賬戶顯示的情況,但兩組之間並無顯著差異。

谷歌雖然拒絕透露在公衆版本和測試版之間顯示“人工智能概述”的數量差異,但阿德里安斯表示,參與測試的用戶在更多的查詢中看到了“人工智能概述”。

BrightEdge的數據還揭示了谷歌認爲“人工智能概述”在哪些主題上最有幫助。在健康關鍵詞搜索中,人工智能生成的答案出現的頻率最高,最近爲63%。BrightEdge包括的樣本查詢中有“足部感染”、“腸道出血”和“遠程醫療緊急護理”等。相比之下,電子商務相關的搜索顯示頻率大約爲23%,而餐館或旅遊相關的查詢很少觸發人工智能概述。

Yu對這些結果表示驚訝,因爲健康相關的問題特別敏感,而谷歌近年來一直在努力改進對此類查詢的展示內容。

搜索引擎優化平臺seoClarity高管馬克·特拉弗哈根(Mark Traphagen)也對谷歌如何處理醫療保健相關的查詢表示關注。爲了監控“人工智能概述”的推廣情況,該公司正在跟蹤一段時間內對數千個搜索詞的響應。在包括“如何治療失眠”和“萊姆病症狀”在內的26個流行的健康相關關鍵詞中,谷歌顯示的人工智能回答的頻率約爲58%。

像 Yu一樣,特拉弗哈根對“人工智能概述”在這類查詢中的出現頻率感到意外。但他們認爲,谷歌依賴諸如梅奧診所或美國疾病控制與預防中心等可信網站來回答健康問題的方式是值得稱讚的。“他們真的加強了安全措施,”特拉弗哈根說,“所有的來源都是知名且可靠的。”

儘管如此,谷歌的人工智能回答有時仍會出現錯誤,包括在處理健康問題時。一些專家指出,谷歌聲稱依據高質量來源回答健康問題的做法並不可靠。搜索引擎優化顧問莉莉·瑞(Lily Ray)表示:“它們經常引用並無排名的網頁,包括健康查詢。”她的實驗顯示,“人工智能概述”在處理諸如衰老、增肌和皮膚護理等較爲溫和的健康護理問題時似乎缺乏權威性,但在處理更爲直接的醫療查詢時則表現得更爲強大。

上週,有報道稱人們對谷歌算法用於回答某些健康問題的來源的擔憂。報道指出,“人工智能概述”在回答有關巧克力的健康益處的問題時,參考了一家意大利巧克力和冰淇淋製造商以及一家銷售家庭“腸道智能測試”套件的公司的網站。

週一上午,當在谷歌查詢“巧克力是否健康?”時,所顯示的“人工智能概述”引用了同一家意大利巧克力公司的信息,以及一家位於明尼蘇達的巧克力商的網站。但在下午重複查詢時發現,谷歌已對此做出改進:之前引用的巧克力公司已從引用列表中刪除,取而代之的是四家信譽良好的醫療機構網站。儘管如此,答案仍然提到專家建議每天食用一小塊黑巧克力,這在醫學上至多是一個有爭議的總結。

儘管“人工智能概述”的開端並不順利,但BrightEdge的 Yu認爲,從長遠來看,人工智能搜索是趨勢所在。“從大局來看,搜索領域的人工智能時代不可避免,我認爲它會變得更好。”這或許是事實,但是否一個全新且改良的“人工智能概述”能夠通過顯著的改進來修復其聲譽損害,則仍是一個未決的問題。(辰辰)