英偉達(NVDA.US)新的增長點來了:重磅推出印地語AI模型
智通財經APP獲悉,全球AI芯片霸主英偉達 (NVDA.US) 週四爲印度廣泛使用的當地語言——印地語,針對性地推出了一款輕量級的人工智能模型,此舉凸顯出英偉達在整個印度市場的AI野心不僅限於英偉達堪稱處於壟斷地位的AI基礎設施領域——即爲印度發展人工智能技術提供AI GPU這一最核心基礎設施,還希望借印度當地語言AI模型進入印度這一不斷增長的人工智能軟件市場。
在這一消息出爐前一天,英偉達CEO黃仁勳在訪問丹麥時透露,在臺積電 (TSM.US)提供的重大幫助下,其最新款的AI GPU——Blackwell架構AI GPU的一個影響芯片製造的重要設計缺陷已得到全面修復。黃仁勳週三表示,該公司最新的Blackwell架構AI GPU曾存在設計缺陷,“它的功能非常強大,但設計缺陷導致良率剛開始很低。”他表示,這一缺陷“100%是英偉達的錯”,後來全靠臺積電協助才得以從這一挫折中恢復過來,並“以驚人的速度”恢復芯片製造工作。
華爾街大行摩根士丹利預計,英偉達2024年第四季度Blackwell架構AI GPU有望批量出貨,預計Blackwell Q4貢獻的營收將達到100億美元,且利潤率將非常高。
這家總部位於加利福尼亞的芯片巨頭在週四表示,其首席執行官黃仁勳將在印度商業之都孟買與印度信實工業集團的主席、亞洲首富穆克什·安巴尼進行面對面會談。
英偉達表示,該公司正在向印度全面推出一款全新的輕量級語言模型,名爲“Nemotron-4-Mini-Hindi-4B”,擁有40億級別參數,供印度國內各大公司用於開發自己的類似ChatGPT的人工智能應用程序,或者在該輕量級基礎上用於打造能力更強大或者專業性更精確的人工智能模型。
英偉達週四在一份聲明中表示:“該人工智能模型經過修剪、蒸餾以及預訓練,充分結合了現實世界的印地語大數據體系、合成化的印地語數據以及基本上等量的英語數據。”
英偉達在聲明中透露,來自印度的IT服務和諮詢公司Tech Mahindra是第一個使用英偉達AI模型產品開發名爲Indus 2.0的定製化人工智能模型的印度公司,經過該公司調整後的這一款定製化AI模型專注於印地語及該國的數十種方言。
據瞭解,印度憲法承認高達22種語言,雖然印度乃英聯邦成員國,但是印度高達14億人口中僅僅有十分之一的人會用英語進行日常交流與表達。
從大型公司到初創科技公司,印度的企業當前都專注於基於其多種本國語言來構建人工智能模型,以增強對於印度龐大消費者羣體的吸引力,並推動高質量客戶服務以及本國語言的內容翻譯等諸多企業經營活動與生成式人工智能全面融合,力爭能夠藉助AI不斷提升企業盈利水平以及企業經營效率。
與應用於爲 ChatGPT等具備強大推理能力的AI聊天機器人提供支持的大型語言模型(比如 OpenAI推出的GPT-4/GPT-4o)截然不同的是,輕量級的小型語言模型參數級別較低,通常是在更小、但是更加具體的數據集上進行預訓練,它們通常價格更便宜,且易於根據公司本身的需求進行定製化調整,能夠打造出在某些領域精準度更高的生成式AI應用程序,這些都使得它們對AI算力資源較少的公司更具吸引力。相比於通用級別的AI大模型,輕量級AI模型通常被用於特定任務或應用中,比如針對於特定客戶羣體的AI智能客服、特定語言的文本生成、翻譯等。
包括英偉達、美光以及應用材料在內的全球頂級芯片公司正在印度投資並加速建立工廠,以擴大在經濟快速增長的印度市場的業務,並且該國在莫迪政府提供的鉅額資金支持下,正在努力建立其半導體產業鏈,給予國外芯片大廠,尤其是芯片製造類大廠豐厚補貼,以便能夠與韓國、中國臺灣等全球主要半導體中心進行競爭。
但是分析師們普遍表示,印度建立起最基本的半導體產業鏈可能需要數年時間,預計2030年之前可能難以達成。據瞭解,近二十年前首次在印度開設實體店面的英偉達在印度設有工程與設計中心,並在印度南部的科技中心班加羅爾和鄰近的海德拉巴等主要城市設有英偉達辦事處。
軟件業務,或將助推英偉達股價觸及200美元
華爾街知名投資機構Rosenblatt表示,相比於英偉達AI GPU創收,更加看好以CUDA爲核心的軟件業務帶來的創收規模。Rosenblatt芯片行業分析師Hans Mosesmann在一份研報中將該機構對英偉達的12個月內目標股價從140美元大幅上調至每股200美元的驚人水平,位列華爾街對於英偉達的最高目標價。
根據知名研究機構IDC《全球人工智能和生成人工智能支出指南》的一項最新預測,該機構預計到 2028 年,全球人工智能 (AI)相關的支出(重點包括人工智能支持的應用程序、AI 芯片等人工智能基礎設施以及相關的 IT 和商業服務)較當前將至少翻番,預計將達到約 6320 億美元。人工智能,特別是生成人工智能(GenAI)快速融入各種終端設備與產品,IDC預計全球人工智能支出將在2024-2028年的預測期內實現29.0%的複合年增長率(CAGR)。
IDC指出,軟件或應用程序將是最大規模的人工智能技術支出類別,在大多數預測中佔整個人工智能市場的一半以上。IDC預計人工智能軟件的五年期(2024-2028)複合年增長率將達到33.9%。這也是爲什麼英偉達不僅聚焦於在AI基礎設施領域堪稱壟斷的AI GPU的營收規模,近期更加聚焦於AI大語言模型、輕量級模型以及推動全球企業在基於英偉達高性能AI GPU的雲端推理算力以及基於CUDA平臺提供的加速基礎上部署AI應用。
CUDA生態壁壘,可謂是英偉達的“最強大護城河”。英偉達在全球高性能計算領域已深耕多年,尤其是其一手打造的CUDA運算平臺風靡全球,可謂AI訓練/推理等高性能計算領域首選的軟硬件協同系統。CUDA加速運算生態是英偉達獨家開發的一種並行化計算加速平臺和編程輔助軟件,允許軟件開發者和軟件工程師使用英偉達GPU加速並行通用計算(僅支持英偉達GPU,無法兼容AMD以及英特爾等主流GPU)。
關於如何微調AI模型,以及如何以低技術門檻且無需購置任何昂貴AI GPU的方式進行AI模型定製化調整,英偉達也爲企業或個人用戶們提供了一套完整的雲端解決方案。基於無比強大且滲透率極高的CUDA平臺和性能強大的AI GPU,英偉達近期在軟硬件全棧生態方面的佈局可謂不斷加碼。英偉達在3月GTC正式推出名爲“NVIDIA NIM”的微服務,按每GPU使用時間收費,它是專注於優化的雲原生微服務,旨在縮短基於各類型AI模型的生成式AI應用上市時間並簡化它們在雲端、數據中心和 GPU 加速工作站上的部署工作負載,使得企業能夠在英偉達AI GPU雲推理算力以及基於CUDA平臺提供的加速基礎上部署AI應用,尋求建立專屬英偉達GPU體系的AI應用全棧開發生態。