代號“UXL”:第一個反英偉達CUDA霸權聯盟
本文系基於公開資料撰寫,僅作爲信息交流之用,不構成任何投資建議。
如路透社在報道說,英偉達正在通過生產人工智能芯片贏得了 2.2 萬億美元的市值,這些芯片已成爲從OpenAI初創公司到谷歌和微軟等傳統巨頭的生成式人工智能開發人員的新時代命脈。
“與其硬件幾乎同樣重要的是該公司近 20 年的計算機代碼,這使得與該公司的競爭幾乎不可能。全球超過 400 萬開發者依靠 Nvidia 的 CUDA 軟件平臺來構建 AI 和其他應用程序。”路透社接着說。
現在,一個包括高通、谷歌和英特爾在內的科技公司聯盟,計劃通過追趕芯片巨頭的秘密武器來拜託英偉達的束縛——讓開發人員與英偉達芯片保持聯繫的軟件(CUDA)。他們是不斷擴大的金融家和公司羣體的一部分,這些金融家和公司正在削弱英偉達在人工智能領域的主導地位。
而他們倚仗的這個聯盟就是UXL,而該聯盟的技術底座,則脫胎於英特爾之前一直開發的One API。
01
UXL的成立,異構計算的必然結果?
UXL是Unified Acceleration的簡稱,也就是統一加速。而爲了推動這個技術的普及,在去年的9月舉辦的Linux 基金會開源峰會上,UXL基金會宣佈成立。按照UXL 生態系統副總裁兼基金會指導委員會主席Rod Burns在一篇文章中的說法,UXL的推動成立,是產業發展的必然結果。
Rod Burns說:“在我的工作生涯中經歷了科技行業的三個重大轉變:第一個是移動軟件極大地改變了手持電腦的可能性;第二個是雲計算爲每個人帶來了大規模計算;第三個是當前加速計算的快速增長。計算機架構正在發生變化,異構計算的理念正在成爲現實。”
所謂異構計算是一個術語,用於描述由多種類型的處理器(例如 CPU 和 GPU)組成的計算機架構,而且還包括越來越多用於人工智能等用途的專用芯片,雖然它不是一個新術語,但它正在推動行業的重大轉變。
然而,對數據密集型工作負載的需求不斷增長,導致 GPU 使用激增,最近基於 LLM(大型語言模型)的 AI 應用程序的出現,導致 GPU 使用量激增,並引起了公衆的廣泛關注。過去 10 年來,GPU 在科學和金融等領域的使用一直呈持續快速上升的趨勢,現在世界上幾乎所有頂級超級計算機都將大量 GPU 作爲其架構的一部分。
根據2023 年 Evans Data 開發人員調查, 75% 的軟件開發人員正在使用或計劃使用高性能計算 (HPC),表明加速器的使用量正在上升。我們現在面臨的挑戰是,Linux 和 GNU 使用開源和基於標準的項目改造了 CPU 的軟件堆棧,而 GPU 軟件堆棧仍然相當新,並且某些領域(尤其是人工智能)的標準仍在定義中。此外,預計專門爲人工智能等最新工作負載設計的專用處理器在未來幾年將需要基於標準的軟件堆棧。我們正在進入一個高度異構的計算機架構新時代。
這一變化爲定義和構建帶來性能可移植性的平臺帶來了巨大的機會。爲了使加速計算變得普遍,它需要基於開放標準幷包括多個供應商和架構。爲了實現這一目標,UXL 基金會宣告成立,並彙集了來自整個行業的創始指導成員——Arm 、富士通、谷歌、Imagination Technologies、英特爾、高通技術公司和三星等公司,以共同爲所有基於開源和標準的加速器構建多架構和多供應商編程模型。
UXL 基金會對加速計算的未來有着變革性的願景。通過構建 oneAPI 規範並利用 SYCL 和 ISO C++ 等基於行業的開放標準,我們將定義一種供應商中立的方式,通過中立性和獨立性爲異構架構開發軟件。除此之外,社區將共同努力發展開源實現,以滿足每個人的需求。
據介紹,oneAPI是一個原本由英特爾推動的,統一的、簡化的編程模型,旨在簡化跨多架構的開發過程(如CPU、GPU、FPGA、加速器)。其核心是核心是英特爾的 Data Parallel C++ (DPC++)——一個建立在 C++ 和 Khronos SYCL 標準之上的語言;SYCL是一種 Khronos 開放標準,自 7 年多前第一個規範發佈以來,一個健康的生態系統已經隨着多種實現、處理器供應商的採用以及整個開發者社區的廣泛使用而不斷髮展。
Rod Burns表示,該基金會將繼續定義核心庫接口的規範,這些接口實現數學和人工智能等基本操作,並與 ISO C++ 和 BLAS 等行業標準相關。開源項目實現了該規範,並且已經擁有多供應商目標,開發人員已經從單個代碼庫(通常是單個二進制文件)編寫了在 AMD、Arm、Intel 和 NVIDIA 處理器上運行的代碼。
02
擺脫CDUA霸權,是最終目標?
在很多分析人士看來,UXL的成立,是這些芯片公司希望能夠聯合起來,打破CUDA霸權。
如文章開頭所說,依賴於性能領先的芯片和CUDA建立起來的護城河,英偉達統治了AI加速器市場,且讓所有人的切換都甚爲艱難。
正如大家所熟知,CUDA 是一種專門爲使用圖形處理單元 (GPU) 加速數學密集型工作負載而開發的加速環境。Nvidia 於 2006 年推出了 CUDA,此後一直在積極開發和改進它。它現在被廣泛使用,但僅適用於 Nvidia GPU。此外,CUDA 的發展以及對提高和推廣 GPU 性能的狂熱關注,使 Nvidia 在人工智能 (AI) 和機器學習 (ML) 模型的訓練中佔據主導地位。
然而,芯片巨頭們不願意坐以待斃。
正如高通人工智能和機器學習主管 Vinesh Sukumar 在接受路透社採訪時表示:“我們實際上是在向開發人員展示如何從 Nvidia 平臺遷移出來。”“基金會計劃構建一套軟件和工具,能夠爲多種類型的人工智能加速器芯片提供支持。該開源項目旨在使計算機代碼在任何機器上運行,無論其使用什麼芯片和硬件。”UXL基金會的人進一步指出。
谷歌高性能計算總監兼首席技術專家 Bill Magro 在接受路透社採訪時表示:“具體來說,在機器學習框架的背景下,我們如何創建一個開放的生態系統,並提高硬件的生產力和選擇。” Magro表示,谷歌是 UXL 的創始成員之一,幫助確定該項目的技術方向。
UXL 的技術指導委員會正準備在今年上半年確定技術規範。高管們表示,工程師計劃在今年年底前將技術細節完善至“成熟”狀態。這些高管強調,需要建立一個堅實的基礎,包括多家公司的貢獻,這些貢獻也可以部署在任何芯片或硬件上。
UXL 計劃將其資源用於解決由少數芯片製造商主導的最緊迫的計算問題,例如最新的人工智能應用程序和高性能計算應用程序。這些早期計劃符合該組織的長期目標,即贏得足夠數量的開發人員使用其平臺。
從長遠來看,UXL 最終旨在支持 Nvidia 硬件和代碼。
當被問及打破英偉達人工智能主導地位的開源和風險投資軟件努力時,英偉達高管an Buck在一份聲明中表示:“世界正在加速。加速計算的新想法來自整個生態系統,這將幫助推進人工智能和加速計算所能實現的範圍。”
根據路透要求 PitchBook 編制的定製數據顯示,風險投資人和企業資金已在 93 項獨立項目中投入了超過 40 億美元。
數據顯示,去年,人們對通過軟件方面的潛在弱點取代 Nvidia 的興趣有所增強,旨在挖掘該公司領導地位漏洞的初創公司在 2023 年的投資額略高於 20 億美元,而一年前爲 5.8 億美元。來自 PitchBook。
在英偉達人工智能數據處理團隊的陰影下取得的成功是很少有初創公司能夠實現的。Nvidia 的 CUDA 是一款引人注目的軟件,因爲它功能齊全,並且在 Nvidia 的貢獻和開發者社區的幫助下不斷髮展。
“但這並不是真正重要的事情,”財務和戰略諮詢公司 D2D Advisory 的首席執行官傑伊·戈德堡 (Jay Goldberg) 說。“重要的是人們已經使用 CUDA 15 年了,他們圍繞它構建了代碼。”
據相關報道,到目前爲止,UXL Group 的開發工作主要集中在名爲 OneAPI 的軟件工具包上。該工具包由英特爾開發,可以編寫可以相對輕鬆地在不同芯片之間移動的人工智能應用程序。OneAPI 基於名爲 SYCL 的早期框架,該框架同樣專注於簡化應用程序的可移植性。英特爾通過多項附加功能擴展了該框架,其中最引人注目的是名爲 SYCLomatic 的功能。它旨在將爲 Nvidia CUDA 編寫的軟件轉換爲能夠在其他公司的 AI 芯片上運行的 SYCL 代碼。
減少將 Nvidia 支持的應用程序遷移到競爭對手芯片所需的工作量和成本,可能會提高企業使用這些芯片的可能性。從長遠來看,這可能會給英偉達市場領先的顯卡帶來更多競爭。
到目前爲止,這項工作已經得到了聯盟成員公司和第三方的技術貢獻。UXL基金會的技術指導委員會預計將在2024年上半年準備其人工智能編程模型的規範。該技術預計將在年底成熟。
但是,值得注意的是,AMD 和 Nvidia 並未出現在該創始人名單中。如上所述,Nvidia 擁有 CUDA,並且是市場領導者。AMD 有 ROCm,目前僅限於支持 AMD 設備。
Tirias Research 的分析人士認爲,如果沒有 AMD 和 Nvidia 的明確支持,UXL 基金會是否能夠實現這些目標存疑。他們表示,Nvidia 目前不需要 oneAPI,因爲它在 CUDA 方面處於市場領先地位。AMD 則是另一個故事。幾乎沒有跡象表明 AMD 的 ROCm 有任何市場動力,而且目前它只是 AMD 獨有的解決方案。(作者:半導體行業觀察)
往 期 推 薦