☰

谷歌發佈智能體原型，能幫你操作表格或者添加購物車

12月12日消息，美國時間週三，谷歌發佈了一款可以自主瀏覽網站的智能體（A.I. agent）。這種實驗性工具能夠瀏覽電子表格、購物網站以及其他在線服務，然後代表用戶執行操作。

目前，聊天機器人可以回答問題、寫詩或生成圖像。未來，它們還可能獨立完成在線購物等任務，並操作電子表格等工具。

谷歌此次推出的智能體原型名爲Mariner。多家科技公司正在開發類似的智能體，包括OpenAI和Anthropic等初創企業，它們也已發佈了能自主使用軟件、網站以及其他在線工具的類似原型。

谷歌最新發布的Mariner基於當天同步亮相的Gemini 2.0人工智能模型。Gemini是谷歌衆多人工智能產品及研究項目的核心技術。同名聊天機器人和能夠直接回答用戶問題的人工智能搜索工具AI Overviews均採用了Gemini的不同版本。

“用戶只需在瀏覽器中輸入請求，Mariner即可代表他們採取相應行動，”谷歌項目經理賈克林·康澤爾曼（Jaclyn Konzelmann）在接受採訪時說道。

Gemini是一種被稱爲神經網絡的數學系統，通過分析海量數據來學習新技能。例如，通過識別從互聯網收集的文章和書籍中的模式，神經網絡可以實現自動文本生成。

最新版Gemini能夠從多種數據類型中學習，包括文本、圖像和聲音。這其中可能包含展示人們如何使用電子表格、購物網站及其他在線服務的圖片。基於Gemini所學到的知識，Mariner能夠代替用戶操作這些服務。

“它知道需要按下哪個按鈕才能完成操作，”谷歌核心人工智能實驗室負責人德米斯·哈薩比斯（Demis Hassabis）在採訪中說道。“它能夠在現實中執行任務。”

康澤爾曼補充道，Mariner設計初衷是與用戶協作完成任務。例如，當用戶在瀏覽器中瀏覽商品時，Mariner可以將物品加入購物車，但購買操作需由用戶親自完成。

谷歌首席執行官桑達爾·皮查伊（Sundar Pichai）在一篇博客中表示，這些技術進步“讓我們更接近實現通用助手的人工智能願景”。

作爲谷歌主流瀏覽器Chrome的擴展功能，Mariner成爲公司人工智能戰略的重要組成部分。然而，這一計劃可能會遭遇障礙。因谷歌搜索引擎被裁定爲非法壟斷，美國司法部已要求聯邦法院強制谷歌出售或拆分Chrome瀏覽器。

此外，這項技術本身也面臨挑戰。康澤爾曼承認，Mariner與其他聊天機器人一樣，會因其基於數據模式運行而犯錯。雖然生成文本時的錯誤有時不易察覺，但當系統嘗試使用網站或執行操作時，錯誤可能更加明顯。

“它目前能做到完全準確嗎？還不能，”康澤爾曼坦言。“這仍然是一項實驗性技術。”

目前，谷歌已向少量外部測試人員開放Mariner，但尚未公佈全面發佈的計劃。

同日，谷歌還展示了新版Project Astra，這款智能手機助手不僅能響應用戶的圖像、文本輸入，還支持語音指令。與OpenAI今年早些時候推出的技術類似，Astra在功能上超越了蘋果Siri等傳統數字助理。

新版Project Astra同樣尚未公開發布。（辰辰）

相關資訊