AI週報|商湯新模型發佈後股價大漲;月之暗面否認創始人套現數千萬美元

商湯發佈日日新5.0:對標GPT-4 Turbo

4月24日,商湯科技股價大漲超過30%後緊急暫停交易。就在4月23日,商湯舉辦技術交流日活動,推出了6000億參數大模型日日新5.0,官方發文表示這是“中國首個GPT-4 Turbo級別的大模型”,日日新5.0大模型具備更強的知識、數學、推理及代碼能力,綜合性能全面對標 GPT-4 Turbo,並在主流客觀評測上達到或超越 GPT-4 Turbo。

在實際使用中,商湯表示該模型在自然語言能力方面,創意寫作、推理以及總結能力均大幅提升,文生圖能力也有較大提升,商湯提到其多模態大模型的圖文感知能力達到全球領先水平。

點評:本次更新主要聚集增強了知識、數學、推理及代碼能力。日日新5.0模型能力提升一方面得益於採用混合專家架構(MoE),激活少量參數就能完成推理,且推理時上下文窗口達 200K 左右,其次模型基於超過10TB tokens訓練、覆蓋了數千億量級的邏輯型合成思維鏈數據,此外也得益於商湯AI大裝置SenseCore算力設施與算法設計的聯合調優。近期Anthropic、Meta等海外企業發佈最新模型,一些基準測試得分超過GPT-4,頗有超車OpenAI的意思,國內終於也有了商湯日日新5.0。與此同時,競爭可能要進入新階段,GPT-5可能今年夏天要推出,OpenAI已放出GPT-5性能遠超GPT-4的信號。

英偉達再出手收購以色列公司

當地時間4月24日,英偉達宣佈,已與以色列公司Run:ai簽訂最終收購協議,英偉達認爲,這能夠幫助客戶更有效地利用其AI計算資源。Run:ai成立於2018年,是一家基於開源容器編排平臺Kubernetes的工作負載管理和編排軟件提供商,公司產品可提高GPU集羣的資源利用率。有消息稱,英偉達收購Run:ai的交易金額爲7億美元。英偉達近期還收購了另一家以色列初創公司Deci,這是一家成立於2019年,提供高效的生成式AI和計算機視覺模型的公司,其解決方案可通過調整AI模型大小使模型在AI芯片上更便宜地運行。

點評:英偉達對以色列初創公司多有青睞,2019年,英偉達還擊敗英特爾、微軟等潛在投資者,以總價約70億美元收購以色列網絡技術供應商Mellanox,這是英偉達佈局高速網絡的一筆重要收購。從這兩筆新收購可以看出,英偉達正在佈局GPU集羣資源高效利用並助力客戶降低使用AI的成本。目前AI大模型算力成本高企有目共睹,大模型訓練一次可能需要上千萬美元,其背後是AI芯片能效難以提升和功耗難以下降。在芯片製程之外,英偉達正在尋求更多解決方案,推動AI平民化實現。

蘋果收購巴黎人工智能初創公司Datakalab

據法國媒體報道,蘋果收購了專注於“人工智能壓縮算法和計算機視覺技術”的巴黎初創企業Datakalab。這筆收購已經於去年12月完成,兩家公司本月向歐盟委員會報告了這筆交易。

Datakalab是一家總部位於法國巴黎的 AI 初創公司,專注於人工智能壓縮和計算機視覺技術。Datakalab 將自己描述爲“低功耗、運行時高效和深度學習算法方面的專家”,系統可以在設備端運行。這家公司曾經在2020年5月與法國政府合作,將AI工具部署到巴黎的公共交通系統,來檢查乘客們是否佩戴口罩。

點評:市場認爲,此次收購是蘋果更廣泛 AI 戰略的一部分,旨在將更復雜的 AI 技術引入其設備,例如即將推出的 iOS 18 機型和未來的 Apple Vision Pro。在今年2月的財報電話會議上,蘋果CEO庫克曾透露,蘋果(在AI方面)有一些令他們感到非常激動的事情,將在今年晚些時候討論。蘋果在大模型領域走得不算快,是要自研還是通過收購補全AI能力,抑或終端設備直接搭載外部大模型公司的產品,外界還在等蘋果作出決策。

OpenAI CEO投資能源初創公司Exowatt

據外媒報道,近日能源初創公司Exowatt獲得了來自OpenAI CEO奧爾特曼(Sam Altman)以及硅谷知名風投公司安德森·霍洛維茨(Andreessen Horowitz)等投資者2000萬美元(約合1.45億元人民幣)的種子輪投資。

Exowatt於2023年成立,旨在用太陽能解決大型數據中心對清潔能源的需求。據悉,與將太陽光直接轉化爲電能的傳統太陽能電池板不同,Exowatt 使用一種獨特的方法,涉及儲存熱量而不是電力,它將太陽能存儲在熱電池中。該公司開發了一款專爲數據中心供電的三合一模塊化能源系統,將集熱器、熱電池,以及能夠提供可調度電力和熱量的熱機進行結合。

點評:這並非奧爾特曼第一次投資能源公司,在此之前,他曾投資 Helion Energy 和 Oklo,這兩家分別是專門從事可控核聚變和核裂變發電的能源公司。AI的盡頭是能源,一份研究顯示,ChatGPT一天可能耗電50萬千瓦時,是美國家庭平均每天用電量的1.7萬多倍。在此前舉辦的達沃斯世界經濟論壇上,奧爾特曼表示,未來人工智能需要能源方面的突破,因爲人工智能消耗的電力將遠遠超過人們的預期。投資能源企業,意味着OpenAI可能寄希望於能源領域的變革爲AI算力提供支撐。

AI搜索初創公司Perplexity AI獲新一輪6300萬美元融資

4月24日,AI搜索引擎初創公司Perplexity AI在社交平臺宣佈,獲得6270萬美元融資,估值10.4億美元。本次由Daniel Gross領投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy等跟投。

Perplexity AI提供生成式AI搜索引擎服務,支持用戶通過自然語言搜索任何信息,可以把Perplexity AI看成搜索引擎版的“ChatGPT”。

資料顯示,Perplexity AI創立於2022年8月,同年9月獲得310萬美元種子輪融資,12月發佈問答引擎“Ask”,隨後其業務實現飛速增長,4個月後月活用戶便突破200萬成爲生成式AI搜索引擎領域的黑馬,這也是能獲得微軟、谷歌、GitHub等投資的重要原因之一。

點評:Perplexity AI表示,像ChatGPT這種問答模式徹底顛覆了應用的交互模式,簡化了大量手動業務,使人們獲取信息的方式更加便捷、廣闊。同時這也爲Perplexity AI提供了機會,通過智能技術創新向傳統搜索引擎發起挑戰。海外對初創公司的大筆融資仍在進行中,可以看出AI搜索引擎仍是一個重要方向。

愛詩科技完成A2輪超億元融資,螞蟻集團領投

4月23日,光源資本官方發文表示,愛詩科技完成A2輪超億元融資,由螞蟻集團領投,光源資本擔任獨家財務顧問。至此,愛詩科技一年內累計獲得融資超2億人民幣,成爲中國視頻大模型領域融資規模最大的創業公司。據悉,本輪融資將用於進一步迭代自研視頻生成大模型,並升級團隊,加快實現 AI 視頻生成技術的行業應用。

點評:愛詩科技成立於2023年4月,創始人兼CEO王長虎曾任字節跳動視覺技術負責人。愛詩科技於2024年1月正式發佈文生視頻產品 PixVerse,官方表示目前月訪問量超百萬,視頻生成量累計超千萬,被創作者廣泛應用於影視、廣告、動漫等內容製作中。創始人王長虎表示,希望未來 AI 原生視頻能夠融入內容行業的生產和消費鏈路,爲 AIGC 領域帶來持續的活力。Sora推出後,國內視頻生成賽道也火熱起來,生數科技已拿出Vidu大模型,愛詩科技接下來的動作備受期待。

視頻大模型Vidu發佈

在2024中關村論壇年會未來人工智能先鋒論壇上,清華大學聯合生數科技發佈中國首個長時長、高一致性、高動態性視頻大模型Vidu。該模型採用團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。Vidu能夠根據提供的文本描述直接生成長達16秒的高質量視頻。

點評:據清華大學教授、生數科技首席科學家朱軍介紹,Vidu採用的是“一步到位”的生成方式。與Sora一樣,文本到視頻的轉換是直接且連續的,在底層算法實現上是基於單一模型完全端到端生成,不涉及中間的插幀和其他多步驟的處理。今年2月Sora發佈後,團隊基於對U-ViT架構的理解及長期積累經驗,在兩個月中進一步突破長視頻表示與處理關鍵技術,推出該模型。從發佈的視頻看,Vidu畫面較真實,但已放出的視頻還是幾秒的視頻,動作銜接還有不流暢之處,後續應還有較大改進空間。

“AIGC第一股”出門問問上市首日破發

4月24日,頂着“AIGC第一股”的名號,出門問問(02438.HK)正式登陸港交所,上市即破發,其發行價爲3.8港元/股,開盤下跌21.58%至2.98港元/股,截至當日收盤出門問問股價爲3.68港元/股,下跌3.16%,市值爲54.89億港元。

據出門問問提交的招股書,該公司2021年—2023年的收入分別爲3.98億元、5億元和5.07億元。2021年—2023年出門問問歸屬於公司權益股東的年內全面虧損總額累計超過20億元,扣除可贖回優先股和普通股的賬面值變動、以股份爲基礎的薪酬和上市開支後,該公司2021年的經調整淨虧損爲0.73億元人民幣,2022年和2023年的經調整淨利潤分別爲1.09億元人民幣和0.18億元人民幣。

點評:出門問問成立於2012年,是谷歌前科學家李志飛創辦的AI公司,以生成式AI與語音交互技術爲核心業務,擁有自研大模型“序列猴子”,爲內容創作者、企業和消費者等用戶提供AIGC(AI生成內容)解決方案、AI企業解決方案、智能設備和配件等服務。出門問問提供的數據顯示,該公司目前在全球擁有超過1000萬名AIGC解決方案用戶,其中約84萬名是付費用戶。上市首日破發,或意味着資本市場對相關AIGC產品的商業化能力仍有顧慮。

騰訊三成代碼由AI代碼助手生成

騰訊雲近日發佈消息稱,騰訊有三成代碼是騰訊雲AI代碼助手寫的。騰訊研發人員比例超74%,騰訊基於混元大模型推出了該AI代碼助手,每天有一半的騰訊員工使用AI代碼助手,代碼生成率超30%。該助手或“AI程序員”可智能補全代碼信息、高效完成編碼工作、修復錯誤代碼、解釋既有代碼、進行人工智能技術對話。騰訊雲AI代碼助手還準備進入金融等更多行業。

點評:越來越多“AI程序員”進入科技大廠工作了。有意思的是,不久前百度透露其每天新增代碼中有27%是由智能代碼助手Comate生成的,比例也接近三成。這或許意味着,現階段AI能替代人類程序員做的工作比例大約是30%,更多可能就不現實了。不久前,Cognition Labs的AI編程產品Devin被質疑編程能力存在一定欺騙性,有問題很多是Devin“自導自演”修復的。將AI作爲人類程序員的幫手而不是替代程序員,是目前比較現實的路徑。值得期待的是,這些大廠除了自己用代碼助手外,後續還會開放給什麼行業、帶來什麼變化。

SK海力士計劃投資超1000億元擴產

有消息稱,SK海力士計劃斥資約20萬億韓元(約146億美元)在韓國建新的存儲芯片產能,進行產能升級,以滿足快速增長的AI開發需求。這家韓國公司將初步撥出5.3萬億韓元,於4月底左右開始建設一家新工廠或晶圓廠,計劃在2025年11月完工。

點評:SK海力士是主要的DRAM(動態隨機存取存儲器)廠商之一,目前因AI需求火爆,由多顆DRAM堆疊而成的HBM(高帶寬存儲器)供不應求,SK海力士是英偉達HBM的主要供應商。除了SK海力士,三星也在努力擠進英偉達供應鏈。因HBM需求拉昇,DRAM廠商之間的競爭儼然變成HBM之爭。除了技術領先性之外,誰能更快速增加產能並快速量產,誰就在AI時代有更多機會。

月之暗面否認創始人楊植麟套現數千萬美元

有消息稱人工智能初創公司月之暗面創始人楊植麟通過售出個人持股已套現數千萬美金,創始人及相關人員套現金額在4000萬美金。還有市場傳言稱,曾參與投資過楊植麟首個創業項目“循環智能”的前金沙江創投管理合夥人張予彤已從金沙江創投離職,將加入月之暗面。對於以上市場傳言,月之暗面相關負責人迴應稱,創始人套現消息不實,月之暗面此前已公佈員工激勵計劃,張予彤並未入職月之暗面。

點評:從既往融資看,月之暗面確實“很有錢”。公司已完成三輪融資,今年2月以15億美金投前估值完成超10億美元B輪,阿里領投,礪思資本、小紅書跟投,投後估值約25億美元,是國內最主要的大模型獨角獸之一。月之暗面此前因長文本的聊天應用kimi受到市場關注,在資本市場甚至帶起一衆“kimi概念股”。不過,高漲的熱度下,外界更期待月之暗面能拿出商用更成功的產品,證明自身具有持續造血的能力。

OpenAI CEO稱GPT-5性能遠超GPT-4

4月25日,OpenAI聯合創始人兼首席執行官薩姆·奧爾特曼(Sam Altman)在斯坦福大學發表演講。在一段流出的視頻中,奧爾特曼表示,GPT-5會更加智能,這將是歷史上最令人矚目的事件之一,GPT-6則將比GPT-5智能很多,而我們遠未觸及極限。對於OpenAI產品迭代,奧爾特曼認爲儘早且頻繁推出AI產品,保持迭代部署非常重要,即便現在看來ChatGPT還有點令人尷尬,GPT-4還顯得愚蠢。要讓社會爲技術進步做好準備,依賴於迭代部署。

點評:隨着多個競爭對手發佈更新、更強的大模型,外界期待OpenAI會拿出什麼樣的產品應對。奧爾特曼透露GPT-5性能遠超GPT-4,更增強了人們的期待。近期關於OpenAI下一代大模型的消息頻繁傳出,中信證券近期研報稱,GPT-5正處於紅隊測試階段,預計最快今年夏天面世,GPT-5預計繼續採用MoE(混合專家模型)架構,有望在多模態理解、長文本輸入等方面取得新里程碑。看來,GPT-5將很快到來。

阿里、百度、騰訊雲搶食Llama 3算力

Meta發佈Llama 3系列兩個開源大模型之後,百度、阿里、騰訊等雲廠商迅速搶食Llama 3的算力部署需求。4月22日,阿里雲宣佈百鍊大模型服務平臺推出針對Llama 3系列的限時免費訓練、部署、推理服務。騰訊雲同日宣佈騰訊雲TI平臺成爲國內首批支持Llama 3全系列模型的平臺之一。4月19日,百度智能雲千帆大模型平臺則宣佈成爲國內首家推出針對Llama 3全系列版本訓練推理方案的雲廠商。

點評:相比推理訓練更具中心化特點的閉源模型,諸多雲廠商都有機會拼搶算力分散的開源模型部署需求。Llama 3已開源版本的基準測試數據亮眼,指令微調的Llama 3 8B在五項基準上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三項基準超過Gemini Pro 1.5和Claude 3 Sonnet。隨着Grok-1、Llama 3等相繼突破開源模型參數上限,潛在算力需求攀升,如果Llama 3 參數量超4000億版本性能媲美GPT-4,部署該模型的需求攀升,接入Llama 3的雲廠商能吃到的潛在算力紅利不會少。

清華大學成立人工智能學院

清華大學成立人工智能學院,聚焦“人工智能核心基礎理論與架構”和“人工智能+X”兩個重點方向,爲實現高水平科技自立自強提供有力支撐。圖靈獎獲得者、中國科學院院士姚期智擔任清華大學人工智能學院首任院長。

點評:清華大學是國內最早開展人工智能教學和科研的單位之一。清華大學1978年建立“人工智能與智能控制”教研組,1985年成立國內第一個智能機器人實驗室,1990年建成全國首個以“智能”命名的國家重點實驗室。此後,清華還相繼成立腦與智能實驗室、未來實驗室、人工智能研究院、人工智能國際治理研究院、智能產業研究院。如今一批人工智能創業團隊有清華背景,包括智譜AI、面壁智能、月之暗面、生數科技等,“清華系”已星光熠熠。此次專門成立人工智能學院並選定重點方向,清華大學有望在人工智能賽道增強引領能力。