亞馬遜AWS發佈新AI芯片,同時提供英偉達H200
11月29日消息,在美國時間週二舉辦的Reinvent大會上,亞馬遜旗下的雲計算部門AWS發佈了新的人工智能(AI)芯片,供客戶構建和運行人工智能應用程序,並計劃提供英偉達的最新芯片。
AWS正試圖以各種高性價比的選擇脫穎而出,成爲雲服務提供商。不過,它不會只銷售廉價的亞馬遜品牌產品。就像亞馬遜的在線零售市場一樣,亞馬遜的雲計算服務也將提供來自其他供應商的頂級產品,包括頂級人工智能芯片製造商英偉達的GPU。
自人工智能初創企業OpenAI去年發佈ChatGPT聊天機器人以來,英偉達GPU的需求就不斷飆升。ChatGPT聊天機器人具有總結信息和撰寫類似真人文本的能力,令人們驚歎不已。這導致英偉達的芯片短缺,因爲各家公司都在競相將類似的生成式人工智能技術整合到自己的產品中。
亞馬遜選擇了雙管齊下戰略,既生產自己的芯片,又允許客戶使用英偉達的最新芯片,這可能會幫助它對抗雲計算領域的頭號競爭對手微軟。本月早些時候,微軟也採取了類似的做法,發佈了其首款人工智能芯片Maia 100,並表示Azure雲將採用英偉達H200 GPU。
具體來說,AWS表示,它將提供英偉達最新H200人工智能圖形處理單元。該公司還發布了新的Trainium2人工智能芯片和通用Graviton4處理器。
新的H200 GPU是H100的升級版,OpenAI曾使用H100來訓練其最先進的大語言模型GPT-4。大型公司、初創公司和政府機構都在爭奪有限的芯片供應,這意味着從亞馬遜等雲服務提供商那裡租用芯片的需求也很高。英偉達表示,H200的輸出速度將是H100的近兩倍。
亞馬遜自己的Trainium2芯片是爲訓練人工智能模型而設計的,包括支持OpenAI ChatGPT等人工智能聊天機器人及其競爭對手運行的基礎模型。亞馬遜表示,初創公司Databricks和OpenAI的競爭對手、亞馬遜支持的Anthropic計劃用新的Trainium2芯片構建模型,新模型的性能將比原來的模型提高四倍。
Graviton4處理器基於Arm架構,比英特爾或AMD的芯片能耗更低。Graviton4承諾比現有的Graviton3芯片性能提高30%,從而實現AWS所說的更高的價格產出。由於通貨膨脹率始終高於往常,這促使央行提高利率,那些希望繼續使用AWS,但爲降低雲服務賬單以更好應對經濟問題的組織可能希望考慮遷移到Graviton上。
亞馬遜表示,超過5萬名AWS客戶已經在使用Graviton芯片。
最後,作爲與英偉達加深合作關係的一部分,AWS表示,它將運營超過16000顆英偉達GH200 Grace Hopper超級芯片,這些芯片包含英偉達GPU和基於Arm架構的通用處理器。英偉達自己的研發團隊和AWS客戶都將能夠利用這一基礎設施。
自2006年推出用於計算和存儲數據的EC2和S3服務以來,AWS已經推出了200多種雲產品。當然,並不是所有服務都大獲成功,有些版本已經很長時間沒有更新,而少數版本已經停產,從而讓亞馬遜釋放並重新分配資源。然而,該公司仍在繼續投資Graviton和Trainium項目,這表明亞馬遜已經意識到了需求。
AWS沒有宣佈搭載英偉達H200芯片的虛擬機實例的發佈日期,也沒有宣佈使用其Trainium2芯片的虛擬機實例的發佈日期。不過,客戶現在就可以開始測試Graviton4的虛擬機實例,幾個月後就可以投入商業使用。(小小)