國泰君安:計算機國產大模型性能領先 場景應用加速落地

智通財經APP獲悉,國泰君安發佈研報稱,DeepSeek-V3的發佈標誌着國產AI在規模、效率和成本方面實現重大突破。DeepSeek-V3在多項評測中超越多款頂尖模型,且成本極具競爭力,其強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。因此AI大模型在各行業落地的技術路徑有望逐步明確,MoE架構的低成本、高性能的大模型在垂類領域中的運用潛力巨大。

國泰君安主要觀點如下:

DeepSeek-V3的強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。

DeepSeek正式發佈了其全新系列模型DeepSeek-V3,並同步開源。該模型爲自主研發的MoE架構,擁有6710億參數和37億激活參數,在14.8萬億token上進行了預訓練。DeepSeek-V3在多個評測中超越了Qwen2.5-72B和Llama-3.1-405B等開源模型,其性能與頂尖閉源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知識類任務、長文本處理、代碼編寫和數學競賽等方面表現出色。

DeepSeek-V3的生成速度提升和靈活的API定價策略爲用戶帶來更高的使用價值。

通過算法和工程上的創新,DeepSeek-V3的生成吐字速度從每秒20次提升至60次,實現了3倍的性能提升,用戶體驗更加流暢。DeepSeek調整了API服務的價格,新的定價爲每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens8元。高性價比有望爲DeepSeek帶來了更大市場份額和收入增長。

DeepSeek-V3的開源權重和本地部署能力增強其社區支持和應用擴展性,推動了技術生態發展。

DeepSeek-V3採用FP8訓練,並開源原生FP8權重,得到開源社區的廣泛支持。DeepSeek提供從FP8到BF16的轉換腳本,方便社區進行適配和拓展應用場景。模型權重可通過HuggingFace平臺下載,進一步促進了本地部署和多樣化應用。這種開放的生態系統爲其在AGI普惠化方面奠定了堅實基礎。

風險提示:較低定價壓縮盈利空間,技術競爭加劇的風險。