谷歌發佈智能體原型,能幫你操作表格或者添加購物車

12月12日消息,美國時間週三,谷歌發佈了一款可以自主瀏覽網站的智能體(A.I. agent)。這種實驗性工具能夠瀏覽電子表格、購物網站以及其他在線服務,然後代表用戶執行操作。

目前,聊天機器人可以回答問題、寫詩或生成圖像。未來,它們還可能獨立完成在線購物等任務,並操作電子表格等工具。

谷歌此次推出的智能體原型名爲Mariner。多家科技公司正在開發類似的智能體,包括OpenAI和Anthropic等初創企業,它們也已發佈了能自主使用軟件、網站以及其他在線工具的類似原型。

谷歌最新發布的Mariner基於當天同步亮相的Gemini 2.0人工智能模型。Gemini是谷歌衆多人工智能產品及研究項目的核心技術。同名聊天機器人和能夠直接回答用戶問題的人工智能搜索工具AI Overviews均採用了Gemini的不同版本。

“用戶只需在瀏覽器中輸入請求,Mariner即可代表他們採取相應行動,”谷歌項目經理賈克林·康澤爾曼(Jaclyn Konzelmann)在接受採訪時說道。

Gemini是一種被稱爲神經網絡的數學系統,通過分析海量數據來學習新技能。例如,通過識別從互聯網收集的文章和書籍中的模式,神經網絡可以實現自動文本生成。

最新版Gemini能夠從多種數據類型中學習,包括文本、圖像和聲音。這其中可能包含展示人們如何使用電子表格、購物網站及其他在線服務的圖片。基於Gemini所學到的知識,Mariner能夠代替用戶操作這些服務。

“它知道需要按下哪個按鈕才能完成操作,”谷歌核心人工智能實驗室負責人德米斯·哈薩比斯(Demis Hassabis)在採訪中說道。“它能夠在現實中執行任務。”

康澤爾曼補充道,Mariner設計初衷是與用戶協作完成任務。例如,當用戶在瀏覽器中瀏覽商品時,Mariner可以將物品加入購物車,但購買操作需由用戶親自完成。

谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)在一篇博客中表示,這些技術進步“讓我們更接近實現通用助手的人工智能願景”。

作爲谷歌主流瀏覽器Chrome的擴展功能,Mariner成爲公司人工智能戰略的重要組成部分。然而,這一計劃可能會遭遇障礙。因谷歌搜索引擎被裁定爲非法壟斷,美國司法部已要求聯邦法院強制谷歌出售或拆分Chrome瀏覽器。

此外,這項技術本身也面臨挑戰。康澤爾曼承認,Mariner與其他聊天機器人一樣,會因其基於數據模式運行而犯錯。雖然生成文本時的錯誤有時不易察覺,但當系統嘗試使用網站或執行操作時,錯誤可能更加明顯。

“它目前能做到完全準確嗎?還不能,”康澤爾曼坦言。“這仍然是一項實驗性技術。”

目前,谷歌已向少量外部測試人員開放Mariner,但尚未公佈全面發佈的計劃。

同日,谷歌還展示了新版Project Astra,這款智能手機助手不僅能響應用戶的圖像、文本輸入,還支持語音指令。與OpenAI今年早些時候推出的技術類似,Astra在功能上超越了蘋果Siri等傳統數字助理。

新版Project Astra同樣尚未公開發布。(辰辰)