Google推出強大AI模型Gemini 讓手機首度直接運作生成式AI
Google在6日發表新的生成式AI模型「Gemini」,將首度可直接在手機上運作。圖爲Alphabet執行長皮伽5月在開發者大會上談論Google的AI事業資料照片。美聯社
Google推出一套新的生成式AI模型「Gemini」,將首度可直接在手機上運作,這是該公司要和ChatGPT開發業者OpenAI等同業競賽所取得的最新突破。
金融時報報導,Google將Gemini形容爲該公司「最大、最有能力、最通用」的AI系統,可分析影像和聲音資訊,並且具有複雜的推理和「規劃」能力。它從6日開始驅動Google的Bard聊天機器人,從明年起更廣泛地整合入Google的搜尋引擎中。
「nano」版本可直接在手機上運作 將整合入Google最新手機
Gemini的其中一個版本「nano」,是專爲在行動裝置上運作而設計的,而且將整合到Google最新的Pixel手機中。Google表示,這會在手機上「原生運作」,而nano模型是針對手機而優化的,因此Android開發人員能夠輕鬆地打造離線使用的AI應用程式(App)與功能,或者把個人資訊更加良好地儲存在私人手機中。」
這樣的進展有助於解答AI技術帶來的經濟問題。利用手機上可取得的運算能力就能運作生成式AI,而非透過由大型科技集團營運的雲端伺服器來運作,將大幅降低運作生成式AI的成本。這也爲希望把私密資料只保留在個人手機的人,提供了一層保障。
Google和Alphabet執行長皮伽在部落格文章中表示:「我相信,我們現在所看到的AI轉型將是我們一生中最深遠的轉變,遠遠超過先前邁向手機或邁向網路的轉變。」
生成式AI在矽谷新闢一塊戰場,各大科技公司都爭相稱霸這塊領域。此前,微軟出資支持的OpenAI、Meta和Anthropic、Mistral等新創公司都發表了AI模型,都能用自然語言產生合理的答案來回應問題,包括用文字、程式碼、圖像和音檔,而Google最新的生成式AI系統也跟進這一趨勢。
上個月,微軟在其廣泛被使用的Microsoft 365生產力應用程式軟體(包含Word、PowerPoint和Excel等)推出一款名爲Copilot的生成式AI助理。
號稱多項測試超越OpenAI的GPT4模型、將被整合入聊天機器人Bard
Google表示,Gemini在用來評估所謂的大型語言模型的產業標準基準測試中得分超過90%。
Google說,Gemini是第一款在特定任務上表現超越人類專家的AI模型,在多項測試中超越OpenAI的GPT4模型。特別的是,它能解決數學推理問題、分析科學數據和撰寫高級程式碼。Google在把新產品展示給記者看時,並未把它與GPT4的模型做比較,但後來在部落格釐清這點。
從6日起,Gemini也將被整合入Google由AI驅動的聊天機器人Bard的英語版本中,可在美國、亞洲和非洲等170多地使用,明年則規劃要升級至威力更強大的軟體。不過,這項產品暫時不在歐洲或英國提供,原因是面臨監管障礙。
Google副總裁兼Bard總經理蕭茜(Sissie Hsiao)表示,這次的整合將提高Bard在內容理解與摘要、推理、腦力激盪、寫作和規劃方面的能力。
Google展示的Gemini用途案例包括掃描手寫的數學公式算式列、標出錯誤並給予解釋。
科技類YouTuber馬克·羅伯(Mark Rober)則展示利用整合Gemini的Bard來執導一段影片,內容是他測試如何手工打造最具空氣動力學的紙飛機。AI建議進行實驗並改善設計,以及如何測試其精準性的方法,包括讓紙飛機射穿火圈。
Gemini版本將在12月提供給一些開發人員與企業客戶,接着在明年更廣泛推出。