比同行低99% 字節挑起大模型價格戰

在AI上“遲鈍”了的字節,憑藉價格“逃逸了一波平庸”。主力模型0.0008元/千tokens,較行業價格便宜99.3%的水平,讓外界直呼字節跳動開啓了大模型的“價格戰”。對行業來說,門檻的下降意味着生態繁榮進程的再度提速,而對字節跳動來說,這場“遲到”的發佈會,或許也意味着龐大的字節正在理順自己做AI的邏輯。

“價格力”

AI也開始講“價格力”了。5月15日,字節跳動豆包大模型在火山引擎原動力大會上正式發佈,目前主要包括通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等9款模型。

豆包大模型原名“雲雀”,是國內首批通過算法備案的大模型之一。但比起首次集體亮相的豆包大模型家族,價格纔是這場發佈會最大的意外和驚喜。

“豆包通用模型Pro 32k模型,正式定價是0.8釐/千tokens,比行業價格降低99.3%。”發佈會上,火山引擎總裁譚待公佈這一數字的話音一落,現場就響起了一陣驚呼和掌聲。以至於讓譚待重複,“對,沒有聽錯,是降低99.3%”。

相比起來,市面上同規格模型的定價一般爲0.12元/千tokens,是豆包模型價格的150倍。火山引擎公佈的價格計算顯示,一元錢能買到豆包主力模型的125萬tokens,大約是200萬個漢字,相當於三本《三國演義》。

什麼支撐了豆包大模型的定價,這可能是定價消息一出,最先跳出來的問題。在發佈會後的羣採中,譚待解釋稱,團隊在技術上有非常多優化手段,包括通過模型結構的優化調整,把成本做低、效果做好,通過分佈式推理、混合調度大幅度降低部署成本等。

調用量給了豆包低價的底氣,而低價則是爲了撬動更大的市場。據悉,經過一年的迭代和市場驗證,豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億tokens文本,生成3000萬張圖片。譚待認爲,降低成本是推動大模型快進到“價值創造階段”的一個關鍵因素。

“豆包的低價使得更多企業和個人能夠負擔得起大模型的使用費用,從而降低了大模型技術的使用門檻,這將有助於大模型在更多行業和場景中的落地應用。”北京市社會科學院副研究員王鵬對北京商報記者進一步分析稱,低價策略有助於吸引更多的潛在客戶,擴大市場份額。隨着用戶基數的增加,大模型的商業化前景也將更加廣闊。

輸不起的競賽

在時間節點上,AI的“價格力”故事也有巧合。兩天前,OpenAI用GPT-4o炸場,在API使用方面,相比GPT-4-turbo,GPT-4o價格降低一半,速度提升兩倍。

同一天,智譜大模型開放平臺上線了新的價格體系。其中入門級產品GLM-3 Turbo模型調用價格下調80%,從5元/百萬tokens降至1元/百萬tokens。

“從全球範圍看,大模型的推理成本,特別是非頂尖大模型推理成本的下降,比之前預估的進度要快得多。”在接受北京商報記者採訪時,互聯網投資人莊明浩如此說道。

而從國內情況來看,低價可能也是一個必然之舉。莊明浩稱,相比起國外屈指可數的幾家大模型企業,國內大模型的競爭環境更爲複雜,頭部企業、明星創業公司林立。但與之相對的是,應用層的爆發卻慢於預期。因此在技術能力已經進入相對瓶頸的階段時,儘可能地拓展應用生態,也是商業慣例。

而在頭部大模型企業中,大洋彼岸的戰況同樣激烈。北京時間5月15日凌晨,谷歌正式反擊OpenAI,不僅帶來了輕量化的模型Gemini 1.5 Flash、AI通用智能體Project Astra等重量級發佈,還推出了OpenAI“跳票”了的AI搜索,捍衛了自己在搜索市場上的地位。

對於如今字節跳動是否會引發降價連鎖反應的問題,王鵬認爲,當一家企業採取低價策略時,其他競爭對手爲了保持或擴大市場份額,往往也會採取相應的降價措施。因此,豆包的低價策略很可能觸發大模型行業的價格戰。

有人甚至戲稱,可能要不了多久,企業調用大模型將不再需要成本,甚至企業調用大模型,相應的大模型企業應該提供補貼。這種玩笑反映了兩個層面的焦慮,一個在於應用生態,另一個在於市場競爭。

譚待也提到,對企業來說,在AI轉型上充滿太多不確定性,必須要讓試錯成本儘量低。

“大模型發展至今,基礎技術到達瓶頸,人們迫切想要知道大模型能夠做什麼,是否真的能實現飛輪效應,這些都需要時間,也需要錢。在這場沒人輸得起的競賽中,是否會走向一種極端的價格戰,誰也說不清。”莊明浩說道。

而對於燒錢的大模型來說,低價是否會壓縮盈利空間,也成爲核心議題之一。對此,王鵬認爲,降價無疑會在短期內對企業的盈利空間造成一定壓力。然而,這種壓力可以通過擴大市場份額和提高使用率來緩解。

從長期看,王鵬認爲,隨着用戶數量的增加和使用頻率的提高,企業可以實現規模經濟,降低單位成本,從而在一定程度上抵消降價帶來的影響。此外,企業還可以通過提供增值服務、定製化服務等方式來增加收入來源,以應對降價帶來的盈利壓力。

“我們不是以虧損爲代價做這件事的,虧損是接受不了的。”羣採中,譚待也提到,定價的基礎是對技術的信心。

遲到的發佈會

2024年初的年度全員會上,字節跳動CEO樑汝波給字節跳動2024年定下的關鍵詞是“始終創業,逃逸平庸的重力”。那場演講中,樑汝波多次提及“危機感”,比如組織平庸化的危機感、遲鈍的危機感。

AI也是危機感的來源之一。樑汝波說,公司層面的半年度技術回顧,直到2023年纔開始討論GPT,而業內做得比較好的大模型創業公司都是在2018—2021年創立的。

這樣的評價其實與外界對字節跳動AI線條過於低調甚至“慢了”的印象不謀而合——此前包括豆包、釦子等產品發佈的消息,大多是以“網傳”的形式而被外界接收,火山引擎原動力大會可能是字節第一場真正意義上聚焦AI的發佈會。

而慢了的字節跳動,也需要找回自己的節奏,無論是產品的發佈,還是“舞臺”上的聚光。

“從傳播角度看,字節跳動過去的AI動作其實非常低調,雖然豆包和釦子的數據不錯,但可能只有最關心這個行業的人才會知道,聲量上遠不如智譜、MiniMax等企業。從這個意義上看,字節跳動需要這樣一場發佈會,讓事情回到應有的狀態裡。”莊明浩說。

事實上,在長達一個小時的羣採期間,豆包準備的時長與現在才發佈的時間點也被多次提及。譚待給出的迴應是,“我們的風格就是不準備好不要說出來”。

在莊明浩看來,字節跳動的“慢”和“低調”,可能都要歸結於組織架構的龐大,“大模型一路發展下來,對這些體量超級大、業務超級複雜的公司而言,梳理好自身的AI戰略本來就是一件非常困難的事”。

莊明浩舉例稱,字節跳動有各種各樣的產品,也很擅長開發,造成如今的情況,更大可能是內部沒有理清楚,到底是以火山引擎還是字節跳動的名義、是以豆包還是釦子的名義,是以to B還是to C的名義講,這些可能都在字節跳動內部經歷了一番博弈,劃分清楚之後,纔有了這樣一場發佈會。

巧合的是,羣採期間,當被問及字節跳動在AI和大模型業務上的整體戰略思考時,現場也有解釋提到,譚待主要負責火山引擎的部分,“可以聊聊火山引擎的戰略,字節跳動的戰略可以回頭再聊”。

北京商報記者 楊月涵