MiniMax副總裁劉華:標準化大模型是未來,技術進化優於定製化 | 最前線

文 | 田哲

編輯 | 蘇建勳

隨着人工智能進入大模型時代,全球科技競爭正逐步聚焦於中美兩國。高昂的算力投入和海量的數據需求,決定了大模型的研發門檻極高,少數領先國家的大模型廠商正在這場技術競賽中爭奪前沿優勢。

MiniMax是較早出海的國內大模型廠商之一,據報道,MiniMax今年的海外收入將超過7000萬美元。

目前,MiniMax已在海外市場推出HailuoAI、Talkie兩大 C 端產品,分別主打AI視頻/音頻生成和 AI 內容社區。36氪獲悉,MiniMax的海外主要收入來源,除出海C端AI應用Talkie目前佔比較大,Hailuo AI訂閱服務和B端API服務也有所提升。

近日,騰訊雲北區雲原生總經理田豐、MiniMax 副總裁劉華,與36氪等媒體展開了一次對話,從全球競爭格局、技術路徑到商業化方向,共同探討了大模型技術的發展趨勢及兩者間的協作價值。

劉華介紹,Talkie除了已有的付費訂閱制之外,廣告業務也是商業化收入來源之一。此外,MiniMax在海外市場暫時不會開發定製化模型項目,目前仍以標準化API 接口服務B端客戶。

原因在於,創業公司應將主要資源投入到核心技術的研發與迭代上,而不是耗費大量精力在滿足個性化需求的定製化項目中。"如果一款大模型需要大量定製化開發才能滿足客戶需求,說明這代模型尚不夠成熟,與其投入時間與成本進行定製,不如加速模型迭代。"劉華表示。

他透露,MiniMax已確定未來的研發路線,主要聚焦於降低模型錯誤率、實現無限長的輸入和輸出、多模態路線發展。

首先,模型錯誤率方面,他認爲上一代的GPT系列模型錯誤率約30%,沒有引起用戶較大重視的原因在於,其較多被用於沒有標準答案的文創領域,如果將大模型用於生產、研發、科研設計等場景,最好把錯誤率降低至個位數。而MiniMax理想中的錯誤率是2%-3%。

其次,隨着大模型任務逐步從文本擴展到語音和視頻,所需的Token 量也在迅猛增加,因此新技術落地的關鍵在於,提高大模型處理大規模輸入和輸出的能力。

目前,MiniMax最新研發的Abab 7系列模型基於 MoE和Linear Attention(線性注意力)機制的新架構,可顯著降低長文本的計算複雜度。

在劉華看來,美國的大模型行業仍保持一定程度的領先。據36氪觀察,OpenAI、Anthropic、XAI等行業頭部廠商佔據了強大的資源和技術優勢,譬如OpenAI的公司規模接近2000人,年度算力成本可能達到百億美元。

不過,中國大模型廠商追趕的速度非常快,尤其在語音和視頻等領域,中國的語音 API 服務已接近 GPT-4o 的水平。如果國內知名科技公司也進入這一賽道,也必然會憑藉其資源優勢佔據重要位置。

劉華認爲,中國的 AI創業公司仍有着廣闊的發展空間。正如MiniMax得到了騰訊雲這類雲廠商支持,同時通過成功的商業化實現了資金循環。

此外,劉華認爲如果需要更好服務國內外用戶,必須堅持自研,打造真正原生性的解決方案,從而擁有具備獨立競爭力的大模型。

談及與MiniMax的合作。騰訊雲北區雲原生總經理田豐介紹,騰訊云爲MiniMax 提供了一系列集計算、存儲、網絡爲一體的高性能智能產品,讓 MiniMax釋放更多的精力聚焦在模型本身的訓練和工程化上。其中,對象存儲產品則提供了元數據加速方案來保障性能,以及多種精細化管理措施進行數據治理,降本增效。數據湖產品則專門針對語料數據預處理進行了專項優化,來提升任務處理性能,幫助MiniMax節約算力 30%以上,性能提升 35.5%以上。

據悉,騰訊雲高性能計算集羣通過一系統化的運維機制,可做到網絡故障一分鐘內發現問題,三分鐘內定位問題,最快五分鐘恢復系統。其千卡集羣的日故障數已刷新至 0.16,是行業平均水平的三分之一。

同時,騰訊雲星脈網絡可支持大模型訓練,實現大模型訓練過程中,網絡通信佔比(通信時間佔總體時間比例)低至6%,整體訓練效率提升了 20% 以上。

正如美國大模型廠商已形成頭部效應,這一現象也將在中國市場出現。劉華認爲,未來只有少數企業研發基礎大模型,大多數企業將逐漸轉向 AI 應用層面的研發。

至於MiniMax,將依然堅持投入核心技術研發,用好的技術驅動好的產品,再讓好的產品帶來好的服務體驗和口碑,反哺技術。