☰

國泰君安：計算機國產大模型性能領先場景應用加速落地

智通財經APP獲悉，國泰君安發佈研報稱，DeepSeek-V3的發佈標誌着國產AI在規模、效率和成本方面實現重大突破。DeepSeek-V3在多項評測中超越多款頂尖模型，且成本極具競爭力，其強大性能與開源策略顯著提升了其市場競爭力，具備高投資價值。因此AI大模型在各行業落地的技術路徑有望逐步明確，MoE架構的低成本、高性能的大模型在垂類領域中的運用潛力巨大。

國泰君安主要觀點如下：

DeepSeek-V3的強大性能與開源策略顯著提升了其市場競爭力，具備高投資價值。

DeepSeek正式發佈了其全新系列模型DeepSeek-V3，並同步開源。該模型爲自主研發的MoE架構，擁有6710億參數和37億激活參數，在14.8萬億token上進行了預訓練。DeepSeek-V3在多個評測中超越了Qwen2.5-72B和Llama-3.1-405B等開源模型，其性能與頂尖閉源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知識類任務、長文本處理、代碼編寫和數學競賽等方面表現出色。

DeepSeek-V3的生成速度提升和靈活的API定價策略爲用戶帶來更高的使用價值。

通過算法和工程上的創新，DeepSeek-V3的生成吐字速度從每秒20次提升至60次，實現了3倍的性能提升，用戶體驗更加流暢。DeepSeek調整了API服務的價格，新的定價爲每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中)，每百萬輸出tokens8元。高性價比有望爲DeepSeek帶來了更大市場份額和收入增長。

DeepSeek-V3的開源權重和本地部署能力增強其社區支持和應用擴展性，推動了技術生態發展。

DeepSeek-V3採用FP8訓練，並開源原生FP8權重，得到開源社區的廣泛支持。DeepSeek提供從FP8到BF16的轉換腳本，方便社區進行適配和拓展應用場景。模型權重可通過HuggingFace平臺下載，進一步促進了本地部署和多樣化應用。這種開放的生態系統爲其在AGI普惠化方面奠定了堅實基礎。

風險提示：較低定價壓縮盈利空間，技術競爭加劇的風險。

國泰君安：計算機國產大模型性能領先 場景應用加速落地

相關資訊

國泰君安：計算機國產大模型性能領先場景應用加速落地