Anthropic 新推 Claude 或將掌控您的電腦?

要是因爲某些原因,您想把個人電腦的完全控制權交給人工智能模型,那現在通過 Anthropic 就能做到。

週二,這家得到亞馬遜支持的 OpenAI 競爭對手發佈了它的 Claude 3.5 Sonnet 模型的新版本。這個模型能在您的桌面上完成一系列基礎任務,像輸入按鍵和鼠標點擊之類的,這樣它就能使用您安裝的任何可能的應用程序了。

Anthropic 的首席科學官賈裡德·卡普蘭(Jared Kaplan)跟《連線》(Wired)說:“我覺得咱們要進入一個新時代啦,在這個時代,模型能用上您個人用的所有工具來完成任務。”

這次更新是 Anthropic 在行業競賽裡的動作,目的是把商業人工智能模型從聊天框的限制裡解脫出來,讓它變成成熟的“人工智能代理”。

“AI 代理”是一個有點模糊的術語,用於描述旨在使用軟件並像人類一樣執行其他計算機任務的以生產力爲導向的 AI 模型,其通用性程度各不相同。

有些,比如認知 AI 的德文(Devin),是專門爲編程設計的。Anthropic 則把它的 AI 代理當作全能型產品來營銷,聲稱它可以瀏覽網頁並使用任何網站或應用程序。您用它做什麼取決於您:它們可以是技術任務,如編程,也可以是更簡單的任務,如旅行計劃。

例如,在《連線》描述的一個演示中,克勞德被要求與朋友計劃一次在日出時參觀金門大橋的旅行。AI 打開網絡瀏覽器,在谷歌上查找一個好的觀賞點以及其他細節,並將旅行添加到日曆應用程序中。令人印象深刻,但《連線》指出,它沒有涵蓋其他有用的細節,比如到底怎麼實際到達那裡。

在另一個演示中,Claude 收到建立一個簡單網站的提示,它藉助微軟的 Visual Studio Code 完成了這一任務。它甚至打開了一個本地服務器來測試剛剛創建的網站。在創建過程中出現了一個小錯誤,不過在得到提示後,人工智能糾正了代碼。

不管這項技術看上去前景多麼好,人工智能模型在可靠性方面依舊存在難題,特別是在編寫代碼方面——Anthropic 的也不例外。

甚至在一個涉及預訂航班和修改預訂的簡單測試中,據 《TechCrunch》 的報道,Claude 3.5 Sonnet 成功完成的這類任務還不到一半。

儘管它們可能很笨拙,但這類人工智能代理也帶來了明顯的安全風險。您會希望這種實驗性的、有時不可預測的技術在您的計算機文件裡到處探查並使用您的網絡瀏覽器嗎?

Anthropic 表示,像這樣發佈它們將有助於人工智能代理更安全——不過,也許是讓您付出代價。

據TechCrunch報道,Anthropic 在一份聲明中寫道:“我們認爲,讓當今更有限、相對更安全的模型訪問計算機要好得多。這意味着我們可以開始觀察和從這個較低級別出現的任何潛在問題中學習,逐步並同時建立計算機使用和安全方面的緩解措施。”