☰

Google推出強大AI模型Gemini 讓手機首度直接運作生成式AI

Google在6日發表新的生成式AI模型「Gemini」，將首度可直接在手機上運作。圖爲Alphabet執行長皮伽5月在開發者大會上談論Google的AI事業資料照片。美聯社

Google推出一套新的生成式AI模型「Gemini」，將首度可直接在手機上運作，這是該公司要和ChatGPT開發業者OpenAI等同業競賽所取得的最新突破。

金融時報報導，Google將Gemini形容爲該公司「最大、最有能力、最通用」的AI系統，可分析影像和聲音資訊，並且具有複雜的推理和「規劃」能力。它從6日開始驅動Google的Bard聊天機器人，從明年起更廣泛地整合入Google的搜尋引擎中。

「nano」版本可直接在手機上運作將整合入Google最新手機

Gemini的其中一個版本「nano」，是專爲在行動裝置上運作而設計的，而且將整合到Google最新的Pixel手機中。Google表示，這會在手機上「原生運作」，而nano模型是針對手機而優化的，因此Android開發人員能夠輕鬆地打造離線使用的AI應用程式（App）與功能，或者把個人資訊更加良好地儲存在私人手機中。」

這樣的進展有助於解答AI技術帶來的經濟問題。利用手機上可取得的運算能力就能運作生成式AI，而非透過由大型科技集團營運的雲端伺服器來運作，將大幅降低運作生成式AI的成本。這也爲希望把私密資料只保留在個人手機的人，提供了一層保障。

Google和Alphabet執行長皮伽在部落格文章中表示：「我相信，我們現在所看到的AI轉型將是我們一生中最深遠的轉變，遠遠超過先前邁向手機或邁向網路的轉變。」

生成式AI在矽谷新闢一塊戰場，各大科技公司都爭相稱霸這塊領域。此前，微軟出資支持的OpenAI、Meta和Anthropic、Mistral等新創公司都發表了AI模型，都能用自然語言產生合理的答案來回應問題，包括用文字、程式碼、圖像和音檔，而Google最新的生成式AI系統也跟進這一趨勢。

上個月，微軟在其廣泛被使用的Microsoft 365生產力應用程式軟體（包含Word、PowerPoint和Excel等）推出一款名爲Copilot的生成式AI助理。

號稱多項測試超越OpenAI的GPT4模型、將被整合入聊天機器人Bard

Google表示，Gemini在用來評估所謂的大型語言模型的產業標準基準測試中得分超過90%。

Google說，Gemini是第一款在特定任務上表現超越人類專家的AI模型，在多項測試中超越OpenAI的GPT4模型。特別的是，它能解決數學推理問題、分析科學數據和撰寫高級程式碼。Google在把新產品展示給記者看時，並未把它與GPT4的模型做比較，但後來在部落格釐清這點。

從6日起，Gemini也將被整合入Google由AI驅動的聊天機器人Bard的英語版本中，可在美國、亞洲和非洲等170多地使用，明年則規劃要升級至威力更強大的軟體。不過，這項產品暫時不在歐洲或英國提供，原因是面臨監管障礙。

Google副總裁兼Bard總經理蕭茜（Sissie Hsiao）表示，這次的整合將提高Bard在內容理解與摘要、推理、腦力激盪、寫作和規劃方面的能力。

Google展示的Gemini用途案例包括掃描手寫的數學公式算式列、標出錯誤並給予解釋。

科技類YouTuber馬克·羅伯（Mark Rober）則展示利用整合Gemini的Bard來執導一段影片，內容是他測試如何手工打造最具空氣動力學的紙飛機。AI建議進行實驗並改善設計，以及如何測試其精準性的方法，包括讓紙飛機射穿火圈。

Gemini版本將在12月提供給一些開發人員與企業客戶，接着在明年更廣泛推出。

Google推出強大AI模型Gemini 讓手機首度直接運作生成式AI

相關資訊