☰

比同行低99% 字節挑起大模型價格戰

在AI上“遲鈍”了的字節，憑藉價格“逃逸了一波平庸”。主力模型0.0008元/千tokens，較行業價格便宜99.3%的水平，讓外界直呼字節跳動開啓了大模型的“價格戰”。對行業來說，門檻的下降意味着生態繁榮進程的再度提速，而對字節跳動來說，這場“遲到”的發佈會，或許也意味着龐大的字節正在理順自己做AI的邏輯。

“價格力”

AI也開始講“價格力”了。5月15日，字節跳動豆包大模型在火山引擎原動力大會上正式發佈，目前主要包括通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等9款模型。

豆包大模型原名“雲雀”，是國內首批通過算法備案的大模型之一。但比起首次集體亮相的豆包大模型家族，價格纔是這場發佈會最大的意外和驚喜。

“豆包通用模型Pro 32k模型，正式定價是0.8釐/千tokens，比行業價格降低99.3%。”發佈會上，火山引擎總裁譚待公佈這一數字的話音一落，現場就響起了一陣驚呼和掌聲。以至於讓譚待重複，“對，沒有聽錯，是降低99.3%”。

相比起來，市面上同規格模型的定價一般爲0.12元/千tokens，是豆包模型價格的150倍。火山引擎公佈的價格計算顯示，一元錢能買到豆包主力模型的125萬tokens，大約是200萬個漢字，相當於三本《三國演義》。

什麼支撐了豆包大模型的定價，這可能是定價消息一出，最先跳出來的問題。在發佈會後的羣採中，譚待解釋稱，團隊在技術上有非常多優化手段，包括通過模型結構的優化調整，把成本做低、效果做好，通過分佈式推理、混合調度大幅度降低部署成本等。

調用量給了豆包低價的底氣，而低價則是爲了撬動更大的市場。據悉，經過一年的迭代和市場驗證，豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一，目前日均處理1200億tokens文本，生成3000萬張圖片。譚待認爲，降低成本是推動大模型快進到“價值創造階段”的一個關鍵因素。

“豆包的低價使得更多企業和個人能夠負擔得起大模型的使用費用，從而降低了大模型技術的使用門檻，這將有助於大模型在更多行業和場景中的落地應用。”北京市社會科學院副研究員王鵬對北京商報記者進一步分析稱，低價策略有助於吸引更多的潛在客戶，擴大市場份額。隨着用戶基數的增加，大模型的商業化前景也將更加廣闊。

輸不起的競賽

在時間節點上，AI的“價格力”故事也有巧合。兩天前，OpenAI用GPT-4o炸場，在API使用方面，相比GPT-4-turbo，GPT-4o價格降低一半，速度提升兩倍。

同一天，智譜大模型開放平臺上線了新的價格體系。其中入門級產品GLM-3 Turbo模型調用價格下調80%，從5元/百萬tokens降至1元/百萬tokens。

“從全球範圍看，大模型的推理成本，特別是非頂尖大模型推理成本的下降，比之前預估的進度要快得多。”在接受北京商報記者採訪時，互聯網投資人莊明浩如此說道。

而從國內情況來看，低價可能也是一個必然之舉。莊明浩稱，相比起國外屈指可數的幾家大模型企業，國內大模型的競爭環境更爲複雜，頭部企業、明星創業公司林立。但與之相對的是，應用層的爆發卻慢於預期。因此在技術能力已經進入相對瓶頸的階段時，儘可能地拓展應用生態，也是商業慣例。

而在頭部大模型企業中，大洋彼岸的戰況同樣激烈。北京時間5月15日凌晨，谷歌正式反擊OpenAI，不僅帶來了輕量化的模型Gemini 1.5 Flash、AI通用智能體Project Astra等重量級發佈，還推出了OpenAI“跳票”了的AI搜索，捍衛了自己在搜索市場上的地位。

對於如今字節跳動是否會引發降價連鎖反應的問題，王鵬認爲，當一家企業採取低價策略時，其他競爭對手爲了保持或擴大市場份額，往往也會採取相應的降價措施。因此，豆包的低價策略很可能觸發大模型行業的價格戰。

有人甚至戲稱，可能要不了多久，企業調用大模型將不再需要成本，甚至企業調用大模型，相應的大模型企業應該提供補貼。這種玩笑反映了兩個層面的焦慮，一個在於應用生態，另一個在於市場競爭。

譚待也提到，對企業來說，在AI轉型上充滿太多不確定性，必須要讓試錯成本儘量低。

“大模型發展至今，基礎技術到達瓶頸，人們迫切想要知道大模型能夠做什麼，是否真的能實現飛輪效應，這些都需要時間，也需要錢。在這場沒人輸得起的競賽中，是否會走向一種極端的價格戰，誰也說不清。”莊明浩說道。

而對於燒錢的大模型來說，低價是否會壓縮盈利空間，也成爲核心議題之一。對此，王鵬認爲，降價無疑會在短期內對企業的盈利空間造成一定壓力。然而，這種壓力可以通過擴大市場份額和提高使用率來緩解。

從長期看，王鵬認爲，隨着用戶數量的增加和使用頻率的提高，企業可以實現規模經濟，降低單位成本，從而在一定程度上抵消降價帶來的影響。此外，企業還可以通過提供增值服務、定製化服務等方式來增加收入來源，以應對降價帶來的盈利壓力。

“我們不是以虧損爲代價做這件事的，虧損是接受不了的。”羣採中，譚待也提到，定價的基礎是對技術的信心。

遲到的發佈會

2024年初的年度全員會上，字節跳動CEO樑汝波給字節跳動2024年定下的關鍵詞是“始終創業，逃逸平庸的重力”。那場演講中，樑汝波多次提及“危機感”，比如組織平庸化的危機感、遲鈍的危機感。

AI也是危機感的來源之一。樑汝波說，公司層面的半年度技術回顧，直到2023年纔開始討論GPT，而業內做得比較好的大模型創業公司都是在2018—2021年創立的。

這樣的評價其實與外界對字節跳動AI線條過於低調甚至“慢了”的印象不謀而合——此前包括豆包、釦子等產品發佈的消息，大多是以“網傳”的形式而被外界接收，火山引擎原動力大會可能是字節第一場真正意義上聚焦AI的發佈會。

而慢了的字節跳動，也需要找回自己的節奏，無論是產品的發佈，還是“舞臺”上的聚光。

“從傳播角度看，字節跳動過去的AI動作其實非常低調，雖然豆包和釦子的數據不錯，但可能只有最關心這個行業的人才會知道，聲量上遠不如智譜、MiniMax等企業。從這個意義上看，字節跳動需要這樣一場發佈會，讓事情回到應有的狀態裡。”莊明浩說。

事實上，在長達一個小時的羣採期間，豆包準備的時長與現在才發佈的時間點也被多次提及。譚待給出的迴應是，“我們的風格就是不準備好不要說出來”。

在莊明浩看來，字節跳動的“慢”和“低調”，可能都要歸結於組織架構的龐大，“大模型一路發展下來，對這些體量超級大、業務超級複雜的公司而言，梳理好自身的AI戰略本來就是一件非常困難的事”。

莊明浩舉例稱，字節跳動有各種各樣的產品，也很擅長開發，造成如今的情況，更大可能是內部沒有理清楚，到底是以火山引擎還是字節跳動的名義、是以豆包還是釦子的名義，是以to B還是to C的名義講，這些可能都在字節跳動內部經歷了一番博弈，劃分清楚之後，纔有了這樣一場發佈會。

巧合的是，羣採期間，當被問及字節跳動在AI和大模型業務上的整體戰略思考時，現場也有解釋提到，譚待主要負責火山引擎的部分，“可以聊聊火山引擎的戰略，字節跳動的戰略可以回頭再聊”。

北京商報記者楊月涵

比同行低99% 字節挑起大模型價格戰

相關資訊