智譜AI給大模型價格戰再添一把火

6月5日,智譜AI推出第四代GLM系列開源模型GLM-4-9B,並對清言App和MaaS大模型開放平臺bigmodel.cn發佈了一系列更新。

GLM-4-9B系列共包含四個版本,分別爲基礎版GLM-4-9B(8K)、對話版GLM-4-9B-Chat(128K)、超長上下文版GLM-4-9B-Chat-1M(1M)和多模態版GLM-4V-9B-Chat(8K)。其中,對話版模型支持多輪對話、網頁瀏覽、代碼執行、自定義工具調用等多個功能。

這款模型預訓練數據量爲10T,是ChatGLM3-6B模型的3倍以上。ChatGLM3爲智譜AI的第三代對話預訓練模型,ChatGLM3-6B則是其中的開源模型。性能方面,第四代模型中英文綜合性能相比前代提升了40%,而上下文從128K擴展到了最高1M tokens(約爲200萬字)。此外,其多語言、多模態等能力也有所提升。

在國內大模型獨角獸陣營中,智譜AI是少數走企業端路線的公司,並及時跟隨DeepSeek的降價步伐,積極參與到DeepSeek掀起的大模型API價格戰中。

GLM-4-9B發佈後,智譜AI宣佈再次降價,有意給大模型價格戰再添一把火。

目前,其MaaS開放平臺已全線接入新模型。其中,GLM-3-Turbo的接入價格從5元/百萬Tokens降爲1元/百萬Tokens,GLM-4V(圖生文)從100元/百萬Tokens降爲50元/百萬Tokens,CogView3(文生圖)則從0.25元/張降爲0.1元/張。

企業權益相關的服務體系中,各類模型降價更爲明顯,最低價格逼近普通權益的60%。GLM-4-Air和GLM-3-Turbo最便宜可至0.6元/百萬Tokens,GLM-4V(圖生文)最低30元/百萬Tokens,性能更強的GLM-4-0520最低爲60元/百萬Tokens,降幅達40%。

據智譜AI COO張帆介紹,當前企業客戶除了要求模型性能和服務成本之外,對於私有化部署和業務場景的價值轉化也有高期待。

對於模型性能和成本的需求,該公司現階段主要是通過模型迭代和降價來實現。針對私有化部署,其MaaS平臺上線了微調功能,允許企業客戶利用自有數據對模型進行訓練。

智譜AI還將目標瞄準了製造、大消費、汽車等領域。此外,團隊在MaaS平臺也嵌入了智能體API,爲開發者羣體提供AI工具。

清言App的進展則在於推出了多智能體協作系統“清言Flow”,強調多輪、多態的對話交互模式,而非單一智能體對話。智譜AI CEO張鵬透露,目前該App已經擁有超過30萬個智能體活躍其中,日均Tokens調用量達到400億次。

就創業公司而言,這算是一個不小的調用量。有媒體報道,字節跳動旗下“豆包”的日均處理量爲1200億Tokens,其涵蓋網頁和App端總體日活超200萬。

不同於行業中普遍認爲企業端市場規模天花板太低的論調,智譜AI仍然選擇在此投入更多精力。當衆多獨角獸角逐用戶端超級應用之時,這家公司想借降價分得更多企業市場蛋糕。

在張鵬看來,當前大模型的Scaling Law並未失效,AI技術的增長進入了一個全新的階段。這意味着,大模型技術的創新依舊是突飛猛進的進行時,甚至還有速度越來越快的跡象。

不過,這條技術曲線的陡峭距離讓更多人體會到AI“有用”還有很長的路要走,對未來的想象力只有化爲現實的生產力才具有真正意義。