定價僅爲GPT-4百分之一! 幻方量化推“高性價比”大模型 量化私募打響AI界價格戰?

21世紀經濟報道記者張梓桐 上海報道

量化私募機構正在高調入局大模型領域。

近日,幻方公司推出了第二代MoE模型DeepSeek-V2,並開源了技術報告和模型權重,該模型引入了MLA架構和自研Sparse結構DeepSeekMoE,以236B總參數、21B激活,實際部署在8卡H800機器上,輸入吞吐量超過每秒10萬tokens輸出超過每秒5萬tokens。

目前DeepSeek-V2 API定價爲:每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。SemiAnalysis給出了“性價比高到難以置信”的評價。據該機構計算,在其算力服務力利用率最高的情況下,DeepSeek每臺服務器每小時收益可達35.4美元,毛利率在70%以上。

事實上,金融機構對AI大模型的佈局有着天然的業務邏輯,在經過移動互聯多年積累後,金融業在行業垂直類大模型落地所需的三大支柱:算法、算力、數據中相較其他行業都有獨特優勢。

“以投研、投顧等與投資決策相關的場景爲例,傳統的投研和投顧模式更多依賴於行業專家和投資顧問自身的知識經驗和能力水平,個體差異度可能會比較大,而大模型經過海量底層數據的蒐集、梳理、學習後,其分析結果或將在全面性、準確性、 時效性等方面賦能傳統模式,但我們也注意到,由於相關監管不明確,以及數據安全、數據隱私等問題,在這些場景的應用仍需謹慎。”畢馬威中國資產管理業主管合夥人王國蓓在接受21世紀經濟報道記者採訪時說道。

AI新徵程

幻方量化是一家依靠人工智能技術進行量化投資的對衝基金公司及科技公司,成立於2008年,專注於人工智能在量化投資領域的應用。

2023年4月14日其官方微信公衆號發表的一篇名爲《幻方新徵程》的文章中,幻方量化宣佈將集中資源和力量,全力投身於人工智能技術,併成立了新的獨立研究組織,專注於探索AGI(人工通用智能,Artificial General Intelligence)的本質。並強調“渴望同行之人,一起攀登”。

但彼時幻方量化的高調動作也遭到市場的質疑。但幻方量化董事總經理陸政哲表示,“我用中文重申一下:AGI不是用來炒股的,有大得多的用處和大得多的價值。”

從技術路徑來看,DeepSeek-V2基於高效且輕量級的框架HAI-LLM進行訓練,採用16-way zero-bubble pipeline並行、8-way專家並行和ZeRO-1數據並行。鑑於DeepSeek-V2的激活參數相對較少,並且重新計算部分算子以節省激活內存,無需張量並行即可訓練,因此DeepSeek-V2減少了通信開銷。

並且,DeepSeek-V2完全開源,可免費上用,開源模型支持128K上下文,對話官網/API支持32K上下文(約24000個token),還兼容OpenAI API接口。

值得注意的是,幻方大模型的橫空出世也再次驗證了市場對於MoE大模型的期待。MoE大模型即Mixture of Experts大模型,是一種基於分治思想的深度學習模型。它將整個模型劃分爲多個子模型(或稱專家),每個子模型負責處理一部分任務。在推理時,根據輸入數據的特性,選擇最合適的子模型進行處理。這種架構使得MoE大模型能夠同時兼顧模型的複雜性和效率,實現高性能和高效率的統一。

金融機構擁抱AI

目前來看,AI+金融產業鏈分爲上游(基礎層)、中游(技術層)和下游(應用層)。上游提供基礎性支持,中游提供核心技術和解決方案,下游則廣泛應用於金融業務領域。

據Mordor Intelligence的報告預測,全球人工智能金融科技市場規模預計到2024年將達到440.8億美元,並預計在2029年將增長到508.7億美元,預測期內(2024-2029年)的複合年增長率爲2.91%。

“因爲與金融機構多業務場景的密切結合,以及產品能力在海量高質金融業務數據助力下得到快速提升,金融機器學習產品成爲市場主要拉力之一。”一家正在嘗試佈局AI應用的私募基金合夥人告訴21世紀經濟報道記者。

他表示,目前,AI在量化交易領域的應用越來越廣泛,通過算法交易提高交易效率,減少人爲錯誤,並能夠快速適應市場變化;另一方面,在投資研究自動化環節,AI可以自動收集和整理投資相關的信息和數據,減少研究人員的重複性工作,使他們能夠專注於更高價值的分析和決策。

“此外,金融機構也在利用AI分析市場情緒,通過分析投資者行爲和市場反饋,預測市場動向。助力金融機構遵守監管要求,通過自動化分析交易模式和行爲,檢測異常交易行爲,防止欺詐和洗錢等非法活動。”

但與此同時,王國蓓表示,在落地過程中,大模型技術財富管理領域面臨的主要挑戰集中於數據質量、數據安全、隱私保護、合規表達、事實一致性等方面,爲解決這些挑戰,機構首先需要進行大量數據治理、夯實數據基礎等工作,且需要在語料安全、模型安全、模型評估等方面設立完善的安全機制,確保大模型生成內容的安全合規並符合監管要求。