下一代AI“超級芯片”呼之欲出

AI芯片巨頭英偉達最備受關注的GTC開發者大會即將召開,全球AI算力走向備受關注。

隨着英國芯片架構企業Arm繼續發力服務器市場,並在近期更新了其服務器處理器Arm Neoverse系列的產品路線圖後,推出兩款基於全新第三代Neoverse IP構建的新的Arm Neoverse計算子系統(CSS)。外界也將初窺下一代整合CPU與GPU的AI“超級芯片”部分面貌,英偉達是否跟進也將備受關注。

Neoverse是Arm於2018年推出、針對數據中心市場的服務器處理器品牌,在Arm規劃下,Neoverse旗下N系列、V系列和E系列各有定位,如V系列即強調性能優先,用於高端服務器市場,上一代Neoverse V2就被用於英偉達的AI芯片設計中。

去年3月,英偉達推出首款將CPU和GPU封裝到一起的“Grace Hopper”GH200超級芯片。其中“Grace”就是英偉達在2021年4月發佈的數據中心Arm CPU系列,“Hopper”即英偉達最新架構GPU量產型號H100。

一位芯片行業投資人告訴界面新聞記者,英偉達的Grace Hopper芯片就是將CPU與頂級AI訓練產品(GPU)一起,打造出“超級芯片”,共同構建了AI完整解決方案。

GH200可用於AI訓練和推理,英偉達通過將一塊CPU與一塊H100 GPU封裝成一整塊芯片,大幅提高了CPU、GPU間數據傳輸效率。在同年11月,英偉達再將GH200升級,將GH200中GPU配備的96GB容量HBM3內存,升級爲144GB的HBM3e,再次大幅提高數據傳輸效率。

在英偉達憑藉GPU產品抓住AI浪潮的過程中,Arm也從英偉達在AI計算的強勢地位中受益,意味着數據中心市場將可能更多采用基於Arm技術的處理器。

Arm基礎設施事業部總經理Mohamed Awad向界面新聞記者解釋,英偉達之前推出的Grace Hopper超級芯片重新設計了系統架構,過去數據中心使用一顆CPU管理多個GPU的設計,而Grace Hopper芯片轉變爲一顆CPU只對應一個GPU。“更多的CPU意味着內存一致性,最終會大大提高GPU的利用率。”

Arm稱,隨着行業對AI算力的需求逐漸由訓練向推理轉型,CPU推理將是生成式AI計算應用的關鍵組成。

但並非所有AI處理都將在CPU上進行。Arm基礎設施事業部產品解決方案副總裁Dermot O'Driscoll以Grace Hopper爲例稱,英偉達對該芯片的一項重要創新在於內存容量和共享內存模式,此類緊耦合CPU設計加上配置AI加速器,對當前流行的大參數大語言模型和其他AI應用非常有益。

爲了使得定製芯片變得更迅速且降低設計難度,Arm於去年推出了Arm Neoverse CSS。在Neoverse CSS中,由Arm配置、優化和驗證完整的計算子系統,並針對各類計算用例進行配置,合作伙伴則專注於軟件調優、定製加速等工作,還能能加速產品上市時間、降低工程成本。

Dermot O'Driscoll指出,Neoverse CSS是專爲幫助客戶在Arm CPU平臺上,快速打造通用計算芯粒而推出的產品。它能提供客戶所需的所有接口,以便選擇耦合自身的加速器。這種方法既可以在需要CPU時提供CPU,又可以在需要AI加速器時提供AI加速器,做到兩全其美。

一直以來,對於自研Arm架構的Grace CPU,英偉達極力淡化與英特爾、AMD的競爭色彩。

黃仁勳曾在2021年向界面新聞記者表示,絕大多數數據中心仍將繼續使用現有x86 CPU,Grace則主要用於計算領域大型數據密集型細分市場,不會對現有CPU廠商帶來“改變遊戲規則”般的影響。

不過,市場格局已經發生了改變。在數據中心市場,Arm正逐漸站穩腳跟,對英特爾、AMD兩巨頭形成挑戰。

根據市場研究機構Counterpoint報告,Arm架構服務器2022年首次在數據中心市場獲得超10億美元收入,其中AWS自研芯片佔該市場3.16%份額,Ampere佔1.52%。隨着微軟在2023年部署其自研的Arm芯片,以及Grace Hopper的出貨,預計Arm在服務器市場份額還將繼續上升。