自研Arm CPU 谷歌造芯突圍

本報記者 李玉洋 上海報道

就在英特爾推出最新AI芯片產品Gaudi 3加速卡來硬槓英偉達、AMD的同一天,谷歌也祭出了首款爲數據中心設計、基於Arm架構定製的新型CPU Axion,谷歌造芯系列最新的一集來了。

美國當地時間4月9日,科技巨頭谷歌在雲年度大會Google Cloud Next 24上宣佈了Axion的存在,並表示Axion性能比通用ARM芯片高30%,比英特爾生產的當前一代X86架構芯片性能高50%,且能效高出60%。

“基於Arm架構的芯片一般都能達到高能源效率,所以不是很出奇,而更好的性能則見仁見智,因爲計算性能的評估需要考慮工作類型。”研究機構Omdia AI行業首席分析師蘇廉節對《中國經營報》記者表示。

對於此番谷歌自研CPU這件事,蘇廉節並不感到意外:“雲大廠都在走這條路,華爲的鯤鵬和阿里的玄鐵就是最好例子。”需要指出的是,玄鐵採用的是另一種非X86架構——RISC-V架構。

儘管當前數據中心CP市場相對穩定,但蘇廉節認爲目前的芯片大廠不該掉以輕心,來自雲大廠的訂單或許會下降,預計到2030年雲廠商自研CPU會佔據整體CPU出貨量的20%。而投資機構ARK invest的預測更爲激進:到2030年,在雲業務領域取代X86架構,Arm+RISC-V的組合所佔據的市場份額將增加至71%。

首款Arm架構CPU

公開資料顯示,谷歌造芯之路是這樣的:自2015年以來,谷歌推出專用芯片張量處理單元(TPU),迄今已發佈了五代;2018年,谷歌發佈了第一個視頻編碼單元(VCU);2021年,谷歌通過投資“片上系統”(SoC)設計,加大了定製計算的投入,併發布了用於移動設備的三代Tensor芯片中的第一款。

而Axion則是谷歌自研芯片家族的最新成員,其基於Arm的Neoverse 2,專爲數據中心設計。根據谷歌雲內部的數據,與當今雲中最快的、基於Arm的處理器相比,Axion提供的實例性能高出了30%;而與當代基於X86的同類處理器相比,Axion的性能高出50%,能效高出60%。

需要指出的是,在此次Google Cloud Next 24大會上,谷歌還推出最新的TPU:TPU v5p,用於訓練和推理的AI加速器,官方宣稱其計算能力是上一代的4倍。據悉,谷歌的TPU是少數英偉達先進AI芯片的替代品之一,而開發者只能通過谷歌的雲平臺使用,不能直接購買。博通是谷歌生產前幾代TPU芯片的合作方,谷歌並未透露設計Axion是否有合作方,以及博通參與推出谷歌雲第五代TPU v5p的情況。

Axion的推出,也意味着谷歌成爲繼微軟和亞馬遜之後第三家用基於Arm架構推出CPU的雲廠商巨頭。2018年,亞馬遜的AWS推出了基於Arm的Graviton處理器;去年,微軟推出了Cobalt 100,同樣是Arm的架構。

視線再轉移到Axion身上。據悉,Axion適用於支持谷歌的搜索引擎和人工智能等一系列任務,將被用於多種谷歌旗下的服務,例如YouTube廣告投放、大數據分析,將於今年晚些時候提供給Google Cloud客戶使用。

谷歌官方表示,Axion該芯片可以通過幫助處理大量數據併爲數十億名用戶部署服務,將在AI領域發揮重要的支持作用。不過,谷歌並沒有將該芯片視爲一種競爭之舉,谷歌負責自研芯片業務的副總裁Amin Vahdat說:“我覺得這是做大蛋糕的基礎。”

相關數據顯示,雖然廣告依然是谷歌最大收入源,但云計算的增長更快,在谷歌的收入中佔比不斷提高,已接近佔公司總收入的11%。據市場研究公司Gartner估算,2022 年,谷歌佔雲基礎設施市場7.5%的份額,而亞馬遜和微軟合計控制着約62%的市場份額。

“X86 CPU的通用性很強,既能兼容前幾代的系統,也能進行新型的應用,但正是由於兼容性的需求導致芯片無法進行徹底的優化,和新型的Arm芯片對比,某些性能還是欠缺。”蘇廉節表示,雲大廠都在自研CPU,所以英特爾、AMD等傳統數據中心CPU芯片大廠不能掉以輕心。

Arm+RISC-V的市場份額將超70%?

在去年Arm上市路演的視頻中,英偉達CEO黃仁勳表示:“數據中心芯片將是驅動未來計算的重要力量,如果沒有Arm芯片技術架構、沒有高性能的Arm CPU支撐、沒有Arm的IP授權系統,英偉達無法制造出超級AI芯片。”

集邦諮詢研究顯示,近年企業對於人工智能、高效能運算等數字轉型需求加速,帶動雲端採用比例增加,全球主要雲端服務業者爲提升服務彈性,陸續導入Arm架構服務器,預期至2025年Arm架構在數據中心服務器滲透率將達22%。

那麼,爲什麼Arm等非X86架構的CPU能在數據中心中分得市場?市場研究公司Counterpoint高級研究分析師 Akshara Bassi曾表示:“儘管英特爾仍然是市場領導者,但其市場份額的損失表明AMD不斷增加的產品組合和優於英特爾的業績。正如AWS和阿里巴巴所證明的那樣,由於各種工作負載部署和Ampere Computing的現成解決方案提供的投資回報率,基於Arm的架構芯片繼續獲得發展勢頭。”

事實上,蠶食X86架構的CPU市場份額,不只是Arm架構,還有開源的RISC-V架構。北京嘉楠捷思信息技術有限公司副總裁湯煒偉曾表示,一個新架構想滲透到一個原來的市場裡面去,往往都是“從低向高”滲透的,但這個路線不適合RISC-V。

“Arm是從C端向B端發展過程中滲透到X86市場的,server(服務器)最終使用者是B端,而PC(個人電腦)最終使用者是C端,C端的一個特點是軟件需求非常多、使用非常友好,才能夠得到廣泛認可,體驗足夠好。”湯煒偉認爲,RISC-V會優先滲透server而不是PC,由於server所使用的軟件偏少,只要能在兩三種軟件取得優勢,就能打開一定市場空間。

記者還注意到,芯片大神Jim Keller加入的加拿大AI芯片獨角獸Tenstorrent也在用RISC-V做CPU。Tenstorrent首席CPU架構師練維漢認爲,AI模型的計算不只是矩陣型運算,還有很多需要CPU來做,比如大語言模型的存取非常破碎、混亂,而這是CPU最擅長做的。

“大語言模型有所謂的KV cache,它是給語言模型的一個情景,比如說我談狗的時候,是你的狗還是我的狗?所以說先把token(令牌)碰到KV cache裡,它去找聊天記錄,像這樣的項目非常多,每次開始一個對話,它就做這樣的事情。”練維漢表示,這是一種不同尋常的隨機存取,所以CPU是個好選擇,未來這樣的情況預計會越來越多,所以CPU+AI引擎是一種好的異構組合。

談及爲何選擇RISC-V來做CPU,練維漢認爲開源和靈活性是選擇RISC-V的重要原因。“RISC-V是開源的,開源的好處是可以做任何修改;從整個計算需求的過程看,靈活性很重要,因爲從客戶端到雲端有很多不同的優化,就需要指令集做靈活的改動。假如用Arm架構的話,任何事情都要和Arm彙報,獲得授權。”練維漢表示,RISC-V是一個非常有靈活性的ISA(指令集架構),是一種計算的未來。

根據ARK invest的預測,到2030年,Arm和RISC-V可能成爲新的處理器標準,在雲業務領域取代X86架構,Arm+RISC-V的組合所佔據的市場份額,將從2020年的零,增加至2030年的71%。

(編輯:吳清 審覈:李正豪 校對:顏京寧)