繼續狙擊英偉達, AMD子彈已上膛丨焦點分析
作者丨邱曉芬
編輯丨蘇建勳
10月10日,一年一度的Advancing AI大會上,美國芯片巨頭AMD發佈了一系列重磅的芯片產品更新,覆蓋AI PC的處理器、EPYC處理器、DPU等等。
在英偉達最新的Blackwell芯片面臨交付困境的當下,AMD最新的GPU產品系列(AMD Instinct MI325X)將如何出牌,直接關係到AMD的未來,自然成爲各界的關注焦點。
在參數上猛追英偉達,是AMD MI系列一以貫之的打法,此次的AMD Instinct MI325X芯片也不例外,選擇緊密對標英偉達上一代芯片產品H200。
不過,好消息是,從產品信息來看,AMD如今逐漸找到了差異化競爭的策略——AMD這款產品逐漸把精力都放在了提升內存、推理能力上。
AMD創始人蘇姿豐發佈AMD Instinct MI325X系列芯片
首先,AMD Instinct MI325X上配備了256GB的HBM3E高帶寬內存,提供了6TB/s的內存帶寬——參數上比英偉達H200大許多(H200分別是141G、4.8TB/s)。
其次,儘管AMD這款產品在FP16(16位浮點數)上的算力沒有英偉達那麼強,但推理能力卻比英偉達H200整體高出20%-40%。
重倉推理,不失爲一項明智之舉。一位行業人士向36氪表示,今年算力中心的一大趨勢是,隨着部分大模型廠商逐漸放下預訓練,推理和模型微調的訴求增加。
“某算力中心客戶,去年預訓練和推理的比例是7:3,今年完全反過來了”。下游大模型、應用廠商的需求變化,上游芯片廠商更需要及時做好策略轉向。
不過,只有單芯片的差異化競爭是遠遠不夠的。AMD此次也從體系化入手,彌補在連接、軟件生態上的短板。而這也正是英偉達的壁壘最高處。
英偉達產品的一大優勢是,依靠NV-Link,使得多個單芯片連接起來之後依舊強大,不因芯片互聯傳遞而折損算力。而此次,AMD則依靠他們的Infinity Fabric互連技術,使得多卡的效果比單兵作戰更強。
據介紹,當8張AMD Instinct MI325X搭配在一起時,相比於同樣數量級的英偉達(即H200 HGX),內存是其1.8倍、內存帶寬是其1.3倍、算力更是其1.3倍。
在軟件生態方面,AMD也持續補短板。AMD的軟件平臺ROCm通過持續調教、以及與多個AI開發平臺深度合作,不僅不會拖後腿,反而提升了整體效率。
經過AMD方面的實測,當跑Meta Llama-2模型時,AMD MI325X單卡在ROCm的加持下,訓練效率超過了英偉達H200。而若用AMD的8卡集羣跑,訓練效率仍也與H200 HGX相當。
在此前的臺北電腦展上,AMD創始人蘇姿豐已經明確,GPU產品節奏向英偉達看齊,要“一年一更新”。AMD除了發佈Instinct MI325X系列之外,也順便透露了未來產品的情況——
據其介紹,AMD下一代芯片Instinct MI350系列將在明年下半年推出,同樣延續了這一代的產品邏輯,推理性能將有35倍提升、提供288GB的HBM3E內存,峰值算力提升1.8倍,與英偉達B200的算力持平。
在逐漸明確了產品打法、發佈節奏後,AMD 2024年在數據中心領域大有高歌猛進趨勢。
蘇姿豐此前透露,AMD已經拿下了上百家AI客戶和OEM廠商的訂單。其在數據中心服務器的份額,也從早前可憐的個位數,上升到如今的30%左右。
財報數據正是最好的說明。7月份,AMD方面公佈的信息顯示,今年第二季度的數據中心業務收入達到了28億美元,雖然相比於英偉達,數據還有很大差距(226億美元),但同比大增115%,也是AMD所有業務中增速最快的一項。
AMD在數據中心領域的突圍,其實是多項因素的綜合作用——除了AMD上一代產品(MI300系列)找對了打法,成爲AMD有史以來的爆款產品之外,還要疊加智算中心市場整體的大爆發,以及一絲對手失誤的因素。
在去年一整年,英偉達的GPU產品受困於產能,交貨週期達到驚人的8-11個月。供應問題,直到2024年第一季度纔有所緩解,但客戶依舊需要等待漫長的3個月。
而好景不長,當英偉達的H系列今年終於順利進入出貨高峰後,其最新的Blackwell系列芯片產品又陷入新一輪交付難題。
綜合多方信息顯示,英偉達原定於今年三季度排產的全新Blackwell系列芯片,因爲芯片設計缺陷,導致穩定性不足,又遇到供應鏈封裝良率不高等原因,整體往後又推遲了一個季度。
當對手持續受困於生產、設計難題,AMD的產品自然成爲彌補算力缺口的一項最佳選擇。
不過,英偉達也擔心錯失市場機遇,把蛋糕拱手讓人,也在努力擺脫延期的陰霾。
在AMD大會的同期,摩根士丹利爲英偉達辦了一場爲期三天的非交易路演。路演上着重向投資人傳遞的信息是——Blackwell的難題已經解決, 需求大熱,英偉達“已經把未來一年內的芯片全部賣光”。
黃仁勳此前也多次在公開場合暗示這一點,提示“這顆芯片正是每個客戶都想擁有最多的產品,大家都想當第一個收到貨的人”。
對於AMD來說,這可能算不上是好消息。隨着對手產能的陰霾散去,幸運的是,AMD也逐漸找到適合自己的競爭節奏。2025年,兩家芯片巨頭,在GPU領域又再一次迴歸正面戰場,這纔是考驗雙方真正綜合實力的關鍵一年。
《AMD發佈銳龍AI PRO 300 系列移動商用處理器,爲AI PC“再添把火” | 最前線》
end