《國際產業》伺服器過熱、臺積電扯後腿?黃仁勳法說給答案

《The Information》日前引述知情人士報導,輝達已經延遲出貨的新AI晶片Blackwell又遇上過熱問題,使一些客戶擔心他們可能來不及建置與啓用新的資料中心。

報導指出,輝達新GPU晶片Blackwell在連接到可容納多達72個晶片的伺服器機架時,會出現過熱的情況。據輝達負責解決該問題的員工以及瞭解該問題的客戶與供應商,輝達已多次要求供應商改變機架設計來解決過熱問題。該報導並未點名是哪些供應商。

當被問及媒體報導一款可容納72個Blackwell GPU的旗艦型液冷式伺服器在初步測試時出現過熱問題,執行長黃仁勳表示沒有過熱問題,微軟、甲骨文、CoreWeave等客戶都正在建置該系統。

黃仁勳表示,我們的Grace Blackwell液冷系統沒有任何問題,相關工程技術一點也不容易,我們正在做的事情很困難,但我們狀況很好。

供應鏈吃緊讓輝達營收更難以大幅超越市場預期、拿出讓投資人大爲驚豔的成績。

市場點名臺積電(2330)是輝達晶片供應的瓶頸之一。黃仁勳拒絕對臺積電的生產問題發表評論,但他在接受路透社訪問時表示,隨着Blackwell提高產量,我們將繼續增加更多產線,我們會不斷提高我們的良率,將改善我們的生產週期(cycle time)。這些都將提升我們的產出。

輝達曾表示,透過修改臺積電用來製造Blackwell晶片的藍圖,已經修復了Blackwell的設計缺陷。

10月底有消息指出,輝達和臺積電因誰出包導致Blackwell良率偏低及延遲發貨而出現嫌隙,當時黃仁勳否認這個傳聞,更直接駁斥這是「假消息」。

黃仁勳當時表示,輝達最新AI晶片Blackwell影響生產的設計缺陷,已經在長期合作伙伴臺積電協助下完成修復。Blackwell有設計缺陷,其功能沒有問題,但該設計缺陷導致良率偏低,而「這100%全是輝達的錯」。

輝達在今年3月推出新一代AI處理器Blackwell,最初宣佈將在第二季出貨,但卻推遲至今。