中國AI長卷(一):大國重算

“中國AI到底發展得怎麼樣了?”在各種社交平臺上,我們經常會看到這樣的問題,也會看到各種各樣的答案,但這些答案有着普遍的缺陷。它們往往只抽取一兩個片段或案例,用非常取巧,甚至有點抖機靈的方式,極端唱好或者唱衰中國AI。

事實上,所謂的中國AI產業覆蓋面非常廣泛。每個領域有各自的發展特點,產業優勢以及產業侷限性,很難用過分簡單的方式,來概括事實上非常複雜的AI產業。

或許,複雜的問題就應該有詳細的答案。就像一幅小畫,畫不盡中國廣袤的山水。

想要探尋中國AI的底色,需要梳理來龍去脈,需要回看一步一景,需要去畫一幅長卷。

今天我們都知道,驅動AI算法工作的“燃油”是AI算力。尤其當深度學習算法發展到了預訓練大模型階段,AI算力已經成爲整個AI領域的最大成本開銷。根據相關數據,算力成本要佔到大模型訓練成本的70%左右,在大模型推理階段則高達95%。

如果說,AI產業是一間工廠,那麼AI算力就是工廠所需的煤和石油。更爲致命的是,這些“煤和石油”的供應處在一種半壟斷狀態。在這次AI復興當中,英偉達用GPU佔據全球AI算力市場的主導地位。英偉達的高端AI算力不僅成本高昂,供不應求,但對於蓬勃發展的中國AI產業來說,能否確保其供應穩定都要打上大大的問號。

在算力貴且不穩的前提下,中國AI產業卻涌現出了巨大的AI算力需求。根據相關數據預測,2030年全球AI算力的需求將達到2020年的500倍。其中,中國AI算力的增長是主要驅動力。目前階段,中美之間的AI算力差不多是1比1.5。種種跡象顯示,未來兩國間的AI算力需求將拉平,甚至中國反超。

成本高昂、供應不穩,需求激增,這三點勾勒出了中國AI算力的整體發展背景。

AI算力就是生產力。在種種令人不安的局面下,中國AI開始了聚沙成塔般的算力突圍。

2017年,是人工智能第三次興起的第一年。在這一年裡,AlphaGO實現了對人類棋手的全面勝利,自動駕駛被廣泛看好,深度學習算法四處開花。而這一切算法表現的背後,都離不開AI算力的支持。

這一年,英偉達拉開了股價飆升,AI算力產品頻繁迭代的大幕。谷歌開始在雲上佈局TPU等自研算力。全球半導體產業開始看到AI算力這個極具想象力的新方向。

而與此前歷次半導體風口不同的是,這次中國的從業者們沒有後知後覺,待產業成熟後再加油追趕,他們選擇了搶跑。

在2017年10月,海思打造了麒麟970,把端側AI算力帶到了華爲手機。11月,中國科學院和寒武紀共同發佈了新一代產品,其中包括面向手機與雲端的AI處理器。這在當時被稱爲全球首個深度學習專用處理器芯片。

如果說,這些芯片還更多集中在端側場景,不能直接對標英偉達提供的高端AI算力,尤其是AI訓練算力,那麼到了2018年,情況就正式發生了改變。

2018年10月,華爲正式發佈了全棧全場景AI解決方案。構成全站全場景AI主體的,是兩款華爲自研的AI芯片,也就是當年發佈了用於推理的昇騰310,以及預告中的昇騰910,伴隨着昇騰這個名字的出現,華爲在AI基礎設施領域的一系列佈局開始浮現出來。

彼時,中美之間的貿易摩擦還沒有開始。中國科技界不會料想到科技封鎖的大棒即將迎面而來,更不會料想到AI算力這個還非常新穎、前沿的概念,居然會在幾年後成爲美國反覆操縱,極力打擊的中國科技“命門”所在。

如果沒有華爲對AI機遇的預判,昇騰在AI算力上的搶跑,或許後面的故事,就會是另一個走向。

2019年到2022年,中國AI算力發展進入第二階段。簡要概述這個階段的發展目標,就是把AI芯片變成了AI算力。

提及AI計算,很多朋友會有種疑惑,一方面國產AI芯片似乎非常多,時不時就能看到相關報道,但另一方面卻又都說AI算力卡脖子。其中的問題,就在於芯片和算力是有區別的。

芯片需要能夠量產,能夠變成板卡、服務器、小站等計算產品,還需要具備全套的軟件生態來幫助用戶進行調用、開發,需要與各個應用場景進行適配,證明可用性。在這一系列問題都得到解決之後,還需要形成足夠大的市場規模。

要頂着性能沒有英偉達好,成本、生態、商業信任全都沒有優勢的逆境走向市場,國產AI算力這條路非常艱難。這也是爲什麼絕大多數國產AI芯片都只能停留在研製成功的新聞通稿裡。

萬幸的是,在中美貿易摩擦的背景下,這一階段重要科技領域的自主可控成爲各界共識,而AI算力在其中首當其衝。所以,國產AI算力沒有像此前的算力國產化議題那樣,反覆被質疑是否有必要自研,全球化採購是否成本更優。因爲理智的科技從業者都知道,AI算力被當作美國的棋子只不過是早晚的問題。

在政策形勢、市場需求,以及頭部科技企業的帶動下,國產AI芯片的算力轉化雖然沒有百花齊放,但也順利完成了階段性的目標升級。

2019年8月,可用於AI訓練,能直接對標英偉達高端產品的昇騰910芯片正式發佈。其整數精度(INT8)算力可以達到640TOPS,整體性能接近了英偉達的A100。這標誌着,中國AI算力的“拳頭產品”來到了全球一線水平。

隨後,昇騰生態的建設全面加速。深圳鵬城實驗室基於昇騰910搭建了“鵬城雲腦Ⅱ”,實現了中國首個自主可控的E級智能算力平臺,可以提供不低於1000Pops的整機AI計算能力和64PB的高速並行可擴展存儲。在武漢等25個城市,搭建了基於‌昇騰AI集羣的人工智能計算中心,藉助“東數西算”熱潮,開啓了雲端AI算力這一新型基礎設施的建設。

其他科技公司,同樣也在這一階段推動着AI芯片走向AI算力。百度在2020年量產了‌崑崙芯1代AI芯片,‌隨後在百度搜索引擎、‌小度等業務中進行了部署。隨後,基於百度自身業務與百度智能雲龐大的AI算力需求,崑崙芯片達成了一定的量產規模。

先後佈局AI芯片的,有華爲這樣的全產業鏈科技公司,也有阿里、百度等基於雲計算業務拓展的AI芯片佈局,同時還有寒武紀、海光信息、燧原科技、天數智芯、壁仞科技、摩爾線程、龍芯中科等半導體企業。中國AI算力的產業縱深,在一定程度上被拉開,IT市場的國產化AI算力選擇也開始多樣了起來。

時間來到2022年,一個關鍵性指標開始浮出。根據IDC發佈數據,2022年中國AI加速卡出貨量約爲109萬張,其中英偉達市場份額約爲85%,昇騰市場佔有率10%,百度崑崙爲2%,寒武紀和燧原科技均爲1%。

這意味着,中國AI計算市場上的國產化佔比已經超過了10%。雖然這個規模看上去依舊不夠大,但它意味着國產AI算力已經獲得了穩定的市場基數,成爲除了英偉達之外,中國AI計算具有可行性的第二選擇。

這是用極限速度跑出來的10%,也成爲中國AI產業的壓艙石。

記得2018年,我與一些AI開發者、AI公司的創始人聊過GPU供應問題。在問到他們是否認爲英偉達GPU會走向斷供的問題時,大家普遍覺得不用擔心,一方面是因爲中國市場足夠大,且增長足夠快,英偉達不可能放棄,另一方面中美之間的AI技術差距還很明顯,美國政府沒有必要在這個領域出手干預。

然而事實證明,達摩克里斯之劍終會落下,我們永遠不能樂觀地認爲科技鐵幕上能打開一扇小窗。

2022年國產AI算力能夠走向規模化商用的另一重推動力,是因爲英偉達高端GPU的禁售風波開始了。在此之前,英偉達雄踞了中國AI芯片市場超過90%的份額。但在2022年10月,美國商務部以擔心軍用轉化爲藉口,對出口中國的AI芯片啓動管制。其中,英偉達的H100和A100等高端GPU成爲主要管制對象。

對於這個荒謬的新規,英偉達也並非沒有尋找出路。作爲禁令的對策,英偉達馬上開發了兩款專爲中國市場設計的“平替”,也就是A800和H800。這兩款GPU性能都低於美國製裁措施規定的閾值,但在性能降低的同時,價格卻進行了上漲。

然而即使這樣的替代方案,也在一年後被宣告“此路不通”。美國商務部在2023年10月宣佈禁止英偉達向中國供應A800和H800,而且新的禁售令不僅影響英偉達,還將AMD和英特爾的芯片覆蓋在內,並且影響了大量芯片設備廠商。這種做法,可謂是堵上了中國獲取中高端AI算力供應的全部大門,甚至計劃對使用亞馬遜雲、微軟雲等美國雲計算平臺來獲取雲端AI算力的中國企業進行限制。鐵閘落下,空餘無奈。

當然,英偉達也並沒停下試試看的腳步。英偉達又一次設計了三款面向中國的“特供版”。其中,能夠用於AI訓練的H20在理論上只有H100的20%綜合性能,縮水之嚴重令人驚歎。

至此我們或許可以說,依靠進口的中國AI算力之路已經被堵得水泄不通,接下來,只能路自己修,步自己走。

幸運的是,修出來的路還不止一條。在今天,國產AI算力已經可以通過多種方式供應市場。它們支撐着百模大戰的繁榮,實現了英偉達禁令甚至沒有激起太大的水花。當然,這些方式互有交疊,用戶可以有多樣化的搭配與選擇。但整體而言,今天中國AI算力的來源有三條途徑:

第一種,全國算力網絡與雲端AI算力。

在科技自立自強的大背景下,幾年來中國極大程度上加強了AI算力設施的基礎建設。作爲“東數西算”的核心組成部分,中國興建了大量智算中心,預計在2025年將提供超過105EFLOPS的AI算力,組成了一張龐大的AI算力網絡。

而作爲與國家AI算力基礎設施結合相對緊密的運營商,也正在加緊提升對算力網絡的利用與挖掘。在目前階段,運營商紛紛加碼雲計算與AI大模型,逐漸形成了雲端AI算力在技術上的成熟與長期成本上的優勢。

與此同時,各大雲計算廠商也加強了AI算力的投入。一方面趕在禁令之前,大量囤積英偉達高端顯卡,另一方面也在探索自研AI芯片的使用,以及對其他國產AI算力的引入。

綜合來看,全國一體化的AI算力網絡,正在成爲中國智能化的主要算力基石。

第二種,昇騰生態。

經過多年的發展,華爲已經將昇騰建設爲國內最爲成熟,且完全沒有英偉達GPU參與的AI計算生態。科大訊飛創始人劉慶峰曾經表示,華爲的昇騰AI芯片可以達到與英偉達A100相當的性能。

相對來說,昇騰的優勢在於軟硬件體系較爲齊備,可以廣泛使用華爲自研的技術進行支持;可以和同樣由華爲打造的鯤鵬生態結合,實現多元計算;整體產業生態較爲繁榮,硬件、軟件合作商豐富。弱勢之處則在於,外界對昇騰芯片還是有性能不足與價格過高的質疑,並且昇騰生態相對封閉,與其他廠商的AI算力生態基本不打通。

今天,中國已經有一半的大模型由昇騰來支撐,並且華爲雲已經將昇騰算力帶到了雲端,推出了昇騰AI雲服務。可以說,昇騰的出現和成長,讓中國有了可以對標英偉達生態的AI算力選擇。

第三種,異構智算。

昇騰之外,大多數AI芯片廠商還無法實現規模化出貨,更多是以參與混合型算力的方式,加入數據中心、企業AI集羣的建設當中。目前情況下,大多數企業與數據中心還是會選擇英偉達來構建AI算力的主體,同時通過加入海光、寒武紀等國產芯片以及加速卡來構建AI算力,或者採取使用英偉達GPU進行訓練,使用國產AI算力進行推理的模式。比如說,百度在文心一言訓練中使用的是英偉達GPU,推理側則使用自主研發的崑崙芯2代。

類似策略,可以逐漸降低對英偉達的依賴度,並且發揮出多元化的AI芯片優勢。由此,異構智算開始成爲企業和數據中心新的需求。面向這種需求,IT廠商也正在捕捉機會。比如聯想推出了完全異構智算平臺,來幫助實現異構化AI算力的管理與調配;新華三推出了面向異構智算的網絡解決方案,解決異構智算帶來的丟包與負載等問題。

這三根“足”,給中國AI算力帶來了某種穩定性。經過極限情況下的多年經營與發展,今天中國AI算力談不上充沛與廉價,至少有了可以遮風擋雨的穩固。

至少我們可以看到,中小企業應用AI算力的綜合門檻正在降低,AI算力的選擇在增多,異構協同能力在加強,並且熟悉了昇騰與海光DCU這樣能夠直接替代英偉達GPU的存在。中國AI是否會因爲算力而陷入生存僵局,已經不再是個問題。

總結一下,在AI算力層面,我們有辦法,但辦法不夠好,其實也不夠多。

然而換個角度想想,幸好我們有方法,否則麻煩就大了。

依靠精準的預判搶跑,在多重助力下超高速發展,在外部壓力下極限成型。

智算,終成國之重器。