通用大模型創業硬核選手亮相 階躍星辰發佈萬億參數MoE大模型預覽版

《科創板日報》3月23日訊 (記者 毛明江 黃心怡)今日,一家頗爲低調的通用大模型創業公司,在上海舉行的2024全球開發者先鋒大會期間正式對外亮相,在公衆面前揭開其神秘面紗。

階躍星辰創始人、CEO姜大昕博士在大會開幕式上對外發布了Step系列通用大模型,包括Step-1千億參數語言大模型、Step-1V千億參數多模態大模型以及Step-2萬億參數MoE語言大模型預覽版。

▍技術大牛雲集 以實現AGI爲目標

階躍星辰成立於2023年4月,聚集了多位人工智能界頂尖人才。其創始人和CEO是前微軟全球副總裁、微軟亞洲互聯網工程院首席科學家姜大昕博士,核心創始團隊包括系統負責人朱亦博博士和數據負責人焦斌星博士。

姜大昕是自然語言處理領域的全球知名專家,在機器學習、數據挖掘、自然語言處理和生物信息學等領域擁有豐富的研究及工程經驗。朱亦博擁有多次單集羣萬卡以上的系統建設與管理實踐經驗。焦斌星此前擔任微軟必應引擎核心搜索團隊負責人,負責利用數據挖掘和NLP算法優化索引和搜索質量。

據悉,階躍星辰自成立起,在算力、數據、算法和系統這四大要素上綜合佈局,在大模型技術路徑上堅定投入攀登Scaling Law。公司創始團隊認爲,攀登Scaling Law是必須堅持但極其艱鉅的任務,階躍星辰團隊因此聚集。公司有信心在通用人工智能領域開啓追趕OpenAI的競逐。

▍官宣Step系列大模型 萬億參數模型可預覽

雖然成立僅一年,階躍星辰團隊對通往AGI的技術路徑,有自己獨到的深入理解。

首先堅定相信Scaling Law是方向,參數量決定了模型智能水平的上限,因此Step-1千億參數語言大模型訓練成功後,隨即開展Step-2萬億參數大模型的訓練工作。

其次是認識到多模理解和生成的統一是通往AGI的必經之路。Step-1V千億參數多模態大模型,在多模理解上做到了業內領先。一方面驗證了Step-1語言大模型的能力,另一方面也爲多模生成打下一個好基礎。

實測是檢驗大模型能力的最好方式。在中國權威的大型模型評估平臺“司南”(OpenCompass)多模態模型評測榜單中,階躍星辰研發的Step-1V 千億參數多模態大模型位列第一,性能比肩 GPT-4V。Step-1V的多模理解能力突出,可以精準描述和理解圖像中的文字、數據、圖表等信息,並根據圖像信息實現內容創作、邏輯推理、數據分析等多項任務。此外,Step-1V亦可實現視頻理解。

千億參數模型只是階躍星辰團隊在攀登通用人工智能路上邁出的第一步。此次階躍星辰還發布了Step-2 萬億參數語言大模型預覽版,提供API接口給部分合作夥伴試用。

Step-2萬億參數語言大模型採用 MoE 架構,聚焦深度智能的探索。據瞭解,參數量從千億到萬億,增長了一個數量級,對算力、系統、數據、算法四個方面都提出了極高的要求,業內只有極少數公司能做到。訓練萬億參數模型體現了階躍星辰的核心技術能力,也說明了公司探索通用人工智能的決心。

▍自有+合作 探索C端應用

當下,模型能力決定了AI應用水平的上限,同時也將創造全新的應用機會。階躍星辰在此方面通過自有產品和合作產品兩種方式,展開了積極探索。團隊研發並推出了兩款面向C端用戶的大模型產品——效率工具“躍問”和AI開放世界平臺“冒泡鴨”。均已全面開放使用。

此外階躍星辰在金融、網絡文學、知識服務等領域已與合作伙伴達成深度合作,共同探索麪向C端用戶的創新應用。

在金融領域,階躍星辰與上海報業旗下界面財聯社達成深度合作,雙方圍繞 AIGC 財經資訊、智能投研、智能投顧等領域推進大模型的應用落地。在網絡文學領域,階躍星辰與中文在線獨家達成深度戰略合作,共同探索大模型在靈感激發、內容創作等網絡文學創作領域的應用。在知識服務領域,階躍星辰與中國知網、中文在線達成戰略合作,圍繞大衆知識服務等場景研究和推進大模型的應用。

“智能階躍,十倍每一個人的可能”,是階躍星辰的企業slogan。當下,大模型技術的研發和落地應用仍在快速迭代和探索中,圍繞這一前沿技術,聚集最頂尖的人才與豐厚的戰略資源,無疑是大模型創業公司的核心競爭力。

階躍星辰在這樣的大環境下從幕後走向臺前,正式亮相併發佈了一系列重要模型與產品,釋放出公司管理層的技術理念與追求:實現通用人工智能或許並不遙遠。