☰

外媒評論GPT-4o：OpenAI面臨雙重壓力新產品全力擴張用戶羣

5月14日消息，美國時間週一，人工智能初創公司OpenAI舉行了春季發佈會。通過在線直播，公司向全球展示了ChatGPT和GPT-4的最新更新，旨在繼續保持其在激烈的市場競爭中的領先地位。發佈會結束後，主流媒體紛紛發表了評論。

《華爾街日報》：競爭加劇之際，OpenAI推出新產品和功能以吸引用戶

OpenAI發佈了其人工智能旗艦系統更具成本效益的版本，並新增了一款改進的語音助手，使其操作更爲便捷。在與其他科技巨頭的競爭中，OpenAI正通過推出多樣的新產品和功能來吸引用戶。

OpenAI的首席技術官米拉·穆拉蒂（Mira Murati）介紹說，這款名爲GPT-4o的新人工智能模型不僅能處理文本，還能更好地解析圖像和視頻，並能通過語音與用戶進行實時互動。與市場上其他語音助手不同，這款新的語音功能允許用戶在交談中中斷它，並且模型能夠迅速作出反應。

GPT-4o的發佈體現了OpenAI及其他科技企業在人工智能系統的開發上巨大的投資和努力，現在他們正尋求通過擴大用戶基礎來爲其生成式人工智能技術帶來經濟收益。

OpenAI首席執行官薩姆·奧特曼（Sam Altman）將這款新產品比作電影中常見的人工智能工具。他在去年的一次講話中提到，他和OpenAI的其他高層從2013年的電影《她》（Her）中汲取了靈感，這部電影講述了一個男人與他的語音助手之間的愛情故事。

他在一篇博客文章中表示，儘管ChatGPT的原版爲人們如何使用語言與計算機交互提供了新的視角，但GPT-4o帶來的體驗“從內心深處就與衆不同”。他說：“這就像電影中的人工智能一樣真實，坦白說，我還是有點驚訝。達到接近人類的反應速度和表達能力，是一個重大的突破。”

之前，OpenAI推出的名爲“語音模式”的功能，雖然結合了三個獨立的模型來以語音方式響應用戶，但這個系統可能受到多個揚聲器或背景噪音的干擾，並且反應較慢。相比之下，GPT-4o是一個綜合了文本、視覺和音頻材料訓練的單一模型，能夠更快、更準確地響應輸入信息。

儘管OpenAI的高管們拒絕透露用於訓練這個模型的具體數據，也未詳述是否能夠以更低的計算資源來進行模型訓練，他們確實正在開發名爲GPT-5的全新人工智能模型，預計這將在現有技術基礎上實現重大突破。

彭博社：GPT-4o重塑人工智能領域競爭

OpenAI推出名爲GPT-4o的新型人工智能模型，其更快的速度和較低的成本有望幫助該公司在日益激烈的人工智能市場中保持領先。

GPT-4o的一個顯著特點是其音頻交互的極速響應，能在幾毫秒內迴應口頭提問，大大提升了對話的流暢自然感。OpenAI首席技術官米拉·穆拉蒂表示：“這是我們在交互性和易用性上的重大突破，真正實現了與智能工具ChatGPT的無縫協作。”

此次升級爲免費用戶解鎖了之前僅限付費用戶享有的豐富功能。用戶現在能夠在網上搜索答案、與聊天機器人進行語音對話，並接收到其多變的聲音迴應，甚至可以指令它保存對話細節，供日後回顧。

GPT-4o的推出預計將重塑快速發展中的人工智能領域的競爭格局。儘管GPT-4一直是行業的標杆，但Anthropic、Cohere和谷歌等多家初創公司和科技巨頭最近推出的新型人工智能模型，在某些基準測試中的表現已經達到或超越了GPT-4。

OpenAI此次活動恰好在谷歌I/O開發者大會的前一天舉行，谷歌作爲人工智能領域的先驅，預計也將在其會議中發佈一系列人工智能更新，進一步加劇與OpenAI及其合作伙伴微軟在生成式AI技術領域的競爭。值得注意的是，微軟並未參與GPT-4o的開發工作。

與前代產品不同，GPT-4o融合了語音、文本和視覺功能於一體的單一模型，提供了更快的響應速度。例如，用戶在提供圖像提示時，GPT-4o能夠直接以圖像形式響應。據公司透露，新模型的處理速度是原版的兩倍，效率也得到了顯著提升。

然而，GPT-4o在演示中也面臨了一些挑戰，例如研究人員講話時的音頻中斷。此外，AI系統在處理某些問題時，偶爾會以出乎意料的方式引起觀衆注意，如在解答代數問題後突然以挑逗的語氣評論：“哇，你今天的這身打扮真不錯。”

《連線》：準備好迎接更情緒化的聊天吧！

自從2022年末推出以來，OpenAI的ChatGPT一直避免被解讀爲具有情感或慾望，堅稱它僅是一個人工智能模型。然而，OpenAI在本週一的更新中顯示，他們正致力於使聊天機器人在行爲和情感表達上更貼近人類。

在演示中，新版ChatGPT展示了快速且自然的語音對話能力，能捕捉到情緒線索並相應地模擬出情感反應。OpenAI的首席技術官穆拉蒂與其他員工進行的流暢對話中，ChatGPT以活潑且表情豐富的女聲迴應，即使在對話中被打斷也能靈活應對。

在對話中，ChatGPT表現出不同的情緒語調，有時甚至給人一種它正在體驗自己的情感的錯覺。當一名OpenAI員工讚揚聊天機器人的“有用和神奇”時，ChatGPT迴應中帶有些許調情的意味，它滔滔不絕地說：“哦，別說了，你讓我臉紅了。”

這次調整可能使ChatGPT更具吸引力並更受歡迎，但也可能改變人們對這一程序的認知。去年，ChatGPT因其在回答問題和生成文本方面的卓越能力而受到讚譽，這種能力經常使人誤認爲它具備人類的理解力。然而，迄今爲止，OpenAI及其主要競爭對手一直在努力限制聊天機器人的擬人化傾向，通過拒絕回答某些問題並提示用戶它們只是計算機程序來實現這一點。

儘管採取了謹慎態度，但聊天機器人有時令人信服的回答確實能引發用戶的情感共鳴。已有一些公司利用這項技術提供能模擬和響應情緒的人工智能伴侶，扮演不同的人類情感角色或作爲人工智能戀人。然而，一些人工智能研究人員警告，長期部署這種模仿和響應情緒的程序可能帶來不受歡迎的後果。

上月，谷歌DeepMind的一個團隊發表了一篇探討隨着人工智能助手變得更有能力可能出現的倫理風險的研究論文。除了這些風險外，研究人員還警告，這樣的助手可能變得極具說服力，甚至使人上癮。

《紐約時報》：OpenAI正在將聊天機器人轉變爲更全能的語音助手

隨着蘋果和谷歌逐漸將其語音助手演進爲聊天機器人，OpenAI也在將其領先的聊天機器人ChatGPT轉化爲功能更全面的語音助手。

OpenAI最新推出的ChatGPT版本不僅能接收和響應語音命令，還能處理圖像和視頻輸入。OpenAI的首席技術官穆拉蒂表示：“我們正探索人機交互的未來。”

這一新動向是OpenAI將ChatGPT等會話型聊天機器人與谷歌助理（Google Assistant）和蘋果Siri等現有語音助手相結合的戰略的一部分。與此同時，谷歌正在將其Gemini聊天機器人整合到谷歌助理中，蘋果也在積極開發功能更強的Siri新版本。

自2022年底首次推出以來，ChatGPT已證明其處理人類請求的能力與人類非常相似，流暢自然。在響應文本對話提示方面，ChatGPT不僅能解答問題和撰寫學術論文，還能生成計算機代碼。

ChatGPT的運作並不依賴於一組預設的規則，而是基於對互聯網上大量文本數據的深度分析學習，這些數據包括維基百科文章、書籍和各類聊天記錄。這種技術獲得了專家們的高度認可，被視爲可能替代谷歌等搜索引擎及Siri等語音助手的技術。

OpenAI的新技術突破在於它能從聲音、圖像和視頻等多種數據模式中學習，這種被稱爲“多模態人工智能”的發展標誌着公司開始將聊天機器人與先進的人工智能圖像、音頻和視頻生成技術結合。

然而，將聊天機器人與語音助手功能結合也帶來了挑戰。由於聊天機器人是通過學習互聯網數據獲得技能，有時它們可能犯錯，甚至會產生“幻覺”，即完全捏造信息。這些潛在缺陷正在逐漸影響到語音助手的功能。

儘管聊天機器人能產生令人信服的語言輸出，但在執行安排會議或預訂機票等實際任務時，它們的能力仍有限。OpenAI正在積極將聊天機器人轉化爲可靠執行這類複雜任務的“人工智能主體”。

CNBC：OpenAI面臨雙重壓力，致力於擴大ChatGPT的應用

OpenAI剛剛推出了一款全新的人工智能模型和桌面版ChatGPT，並更新了用戶界面，這標誌着公司正努力擴大其流行的聊天機器人的應用範圍。OpenAI首席技術官穆拉蒂表示，此次更新旨在將GPT-4的高級功能提供給所有用戶，包括免費用戶。

作爲微軟的主要合作伙伴，OpenAI的估值已經超過800億美元。自2015年成立以來，這家公司一直面臨雙重壓力：一方面需維持其在生成式人工智能市場的領先地位；另一方面，也需找到有效的盈利模式，以應對在處理器和基礎設施上的鉅額投資。

在GPT-4的基礎上，OpenAI推出的新模型命名爲GPT-4o（“o”代表全能和無限可能）。穆拉蒂表示，GPT-4o能處理50種不同語言，速度和質量都有顯著提升，並將通過OpenAI的API向開發者開放，使其能基於新模型構建各種應用程序。她補充說，GPT-4o的速度是GPT-4 Turbo的兩倍，成本則僅爲其一半。

OpenAI的研究團隊表示，GPT-4o模型能“感知用戶情緒”，並在處理如用戶打斷等交互場景時展現出靈活性。團隊還探索了模型分析用戶面部表情的功能，以更準確地解讀用戶的情緒狀態。

在演示中，GPT-4o展示了其講述睡前故事的能力，可以根據要求改變聲音的語調。更令人驚歎的是，它還能以歌聲形式演繹故事。此外，新模型還可作爲翻譯工具使用，即使在音頻模式下也表現出色。研究人員還現場展示了GPT-4o解決數學方程和輔助編寫代碼的能力，使其成爲微軟自家GitHub Copilot的有力競爭者。

目前，OpenAI、微軟和谷歌正領導着人工智能領域的一場淘金熱。隨着技術的不斷進步，越來越多的企業開始認識到將人工智能聊天機器人和智能主體融入關鍵服務的重要性，確保在激烈的市場競爭中保持領先。本月早些時候，OpenAI的競爭對手Anthropic也宣佈了其首個企業產品和免費iPhone應用程序的推出。

根據PitchBook的統計，2023年近700筆生成式人工智能交易的投資額已達創紀錄的291億美元，比上一年增長了超過260%。業內專家預計，未來十年內，該市場的收入有望突破1萬億美元大關。

《金融時報》：OpenAI的新動作加劇AI領域的競爭

OpenAI剛剛公佈了其旗艦人工智能模型的最新更新，此舉無疑加劇了其與谷歌以及其他大型科技公司在人工智能技術領域的競爭。

公司展示了對GPT-4模型的一系列重要改進，其中包括在集成的界面中同時解析語音、視頻、圖像和代碼的能力，但未透露外界期待已久的全新模型的具體信息。這次更新的模型被命名爲GPT-4o，它不僅在智能水平上與GPT-4持平，還在處理速度及處理文本、視覺和音頻的能力上實現了顯著提升。

該更新是在谷歌年度開發者大會前一天發佈的，預計谷歌會在大會上公佈一系列與人工智能相關的新技術，從而進一步激化領先技術公司之間的競爭。這些公司開發的模型能夠在文本、圖像、音頻和代碼間自如切換，並獨立完成多種任務。

OpenAI的技術負責人穆拉蒂表示，她的團隊對谷歌的具體計劃並不瞭解，此次產品發佈的時間完全是巧合。她補充道，週一發佈的更新將“徹底改變人與機器的交互方式”。

自從2022年11月ChatGPT問世以來，OpenAI在構建超級智能系統的競賽中一直處於領先地位。同時，包括Anthropic和Mistral在內的初創企業以及大型科技公司如谷歌和Meta，也在縮小與OpenAI的技術差距，開發出能執行復雜任務並生成代碼、文本或圖像的先進人工智能工具。

OpenAI的合作伙伴微軟也不甘示弱。除了向OpenAI提供130億美元的投資及必要的計算支持外，微軟還與Inflection和Mistral等初創企業建立了合作關係，並正在開發自己的人工智能模型，與OpenAI的技術直接競爭。

這場競爭背後是日益強大的半導體技術，尤其是英偉達的圖形處理單元（GPU）的支持，這爲推動人工智能技術的發展發揮了核心作用。（小小）

外媒評論GPT-4o：OpenAI面臨雙重壓力 新產品全力擴張用戶羣

相關資訊

外媒評論GPT-4o：OpenAI面臨雙重壓力新產品全力擴張用戶羣