預估2024年北美四大雲端服務業者 對高階 AI 伺服器需求量將逾六成

根據TrendForce最新預估,以2024年全球主要雲端服務業者(CSP)對高階 AI 伺服器(包含搭載NVIDIA、AMD或其他高階ASIC晶片等)需求量觀察,預估美系四大 CSP 業者包括Microsoft、Google、AWS、Meta各家佔全球需求比重分別達20.2%、16.6%、16%及10.8%,合計將超過6成,居於全球領先位置。 圖/聯合報系資料照片

根據TrendForce最新預估,以2024年全球主要雲端服務業者(CSP)對高階 AI 伺服器(包含搭載NVIDIA、AMD或其他高階ASIC晶片等)需求量觀察,預估美系四大 CSP 業者包括Microsoft、Google、AWS、Meta各家佔全球需求比重分別達20.2%、16.6%、16%及10.8%,合計將超過6成,居於全球領先位置。其中,又以搭載 NVIDIA GPU 的 AI 伺服器機種佔大宗。

NVIDIA 近期整體營收來源以資料中心業務爲關鍵,主因其 GPU 伺服器佔整體 AI 市場比重高達六至七成,惟後續仍須留意三大狀況,可能使 NVIDIA 發展受限。其一,受美國禁令箝制,中國政府將更致力於 AI 晶片自主化,進一步來說,華爲仍被 NVIDIA 視爲可敬的對手。而 NVIDIA 因應禁令推出的 H20 等中國特規方案,性價比可能不及既有的 H100 或 H800 等,中國客戶採用度可能較先前保守,進一步影響 NVIDIA 市佔率。

其二,在具規模及成本考量下,美系大型 CSP 業者除 Google、AWS外,Microsoft、Meta 等亦有逐年擴大采自研 ASIC 趨勢。其三,來自 AMD 的同業競爭,AMD 採高性價比策略,對標 NVIDIA 同級品,AMD 提供僅60~70%價格,甚至代表性或具規模客戶能以更低價策略方式搶進市場,預期2024年尤以 Microsoft 爲最積極採納 AMD 高階 GPU MI300 方案業者。

NVIDIA 在面臨潛在隱憂下,亦更積極加速拓展其多元產品線,以因應不同客戶羣。2024年起將正式汰換 A100 產品,而以價格更高的H100系列爲主軸。除 H100,預估自今年第2季末開始小量出貨搭載更高 HBM3e 規格的H200產品。另預估 NVIDIA 未來在價格上將更積極採差別訂價,H100 採部分折價策略,H200 應維持約 H100 原價格水位,以提供更高性價比方式,穩固雲端 CSP 客戶。

此外,NVIDIA 將採用 NRE(Non-recurring engineering Expense)模式,與 Meta、Google、AWS及OpenAI等廠商展開洽談,並將目標擴及電信、車用及電競客戶。

此外,預期 NVIDIA 自2024年下半將推出新一代 B100 產品,相較H系列可望在效能上又有所提升,在 HBM 記憶體容量將高出 H200 約35~40%,以因應更高效能 HPC 或加速 LLM AI 訓練需求。而在中低階產品上,除 L40S 針對企業客戶做邊緣端較小型 AI 模型訓練或 AI 推論外,另亦規劃以 L4 取代既有 T4,作爲雲端或邊緣 AI 推論應用。

值得注意的是,爲避免2023年 GPU 供應不足問題,NVIDIA 亦積極參與 CoWoS 及 HBM 等擴建產能需求,預期今年第2季在相關原廠產能逐步開出後,原交付 Lead Time 平均約40周也將減半,逐步去除下游供應鏈因 GPU 短缺而使 AI 伺服器供應進度受阻問題。