AI PC時代來臨|英特爾依舊是技術引領者
AI(人工智能)從誕生至今,經歷了70年;但“AI PC”從提出概念到產品落地的過程,卻如一夜春風來,至今也不到半年時間。
不到半年,AI PC完成從概念到產品落地的華麗演進
今年9月,英特爾CEO帕特•基辛格最早提出了這一概念,按英特爾的設想,AI PC將以空前的速度推進,2025年將有上億臺具備人工智能模塊的PC問世。
緊接着,英特爾在新公佈的處理器構架Meteor Lake明確加入了NPU(英特爾曾在今年6月間披露過這一信息,其AI模塊當時還被稱爲VPU,號稱擁有比基於神經網絡計算的外接式Movidius計算棒算力更加強大)。
10月,聯想等一系列OEM廠商紛紛跟進這一概念,提出了AI For ALL、AI is Everywhere等設想,緊接着開始佈局2024年AI PC產品線,隨着2024年越來越近,我們很快就會看到第一代AI PC產品的落地。
12月15日,英特爾Meteor Lake的第一代酷睿Ultra處理器就將發佈,隨之發佈的還包含第五代英特爾至強可擴展處理器(Emerald Rapids),目前披露出的信息是新平臺AI算力爆漲至前代的8倍。
伴着AI PC概念的發佈,微軟也在積極佈局AI領域,新一代的Windows版本“Hudson Valley”(哈德遜河谷,正式版本極有可能會命名爲Windows 12)將全面佈署AI功能,其中大部分功能均需要NPU的支持才能完成。我們很久都沒在PC上看到,由軟件(操作系統)驅動硬件的飛躍式成長,而AI,極有可能帶來下一波的換機潮。據IDC預測,從2024年誕生的全新品類,將在2027年佔據81%的份額,沒有更換PC的用戶,便享受不到這一波AI帶來的高效率“紅利”。
之所以AI PC會擁有如此快的落地速度,得益於ChatGPT等大語言模型帶來的AIGC浪潮,諸如數字人等AI應用快速得到推廣……不論上至數據中心、下至PC、智能手機等終端,都在迅速推動AIGC的應用,前不久,OPEN AI、微軟甚至推出了不需要編程能力的AI應用市場。
對於普通人來說,應用超算的大語言模型的訓練離我們太遠、太昂貴;而智能手機還不足以承擔真正的生產力工具之能,綜合來看,PC纔是承載AI終端能力的最好平臺,在AI PC概念的佈局中,便是要讓一臺筆記本、甚至輕薄本也具備本地化的AI能力。所以帕特·基辛格明確提出:AI行業目前已經從訓練階段過渡到部署階段,AI更是將成爲PC行業的關鍵轉折點,Intel有信心在未來兩年內領先業界、並於2025年達成出貨超過一億臺AI PC的目標。
在提出AI PC的概念同時,基辛格也同時展望了AI PC運行“個人大模型”的可能,在最大化激化PC的AI算力後,它完全可以將PC改造爲無所不能的AI助手,實現更低延時,更使得,更佳可擴展性,以及更私密的本地化AI應用。
AI佈局,英特爾領先一步,AMD快速跟進
作爲PC處理器的兩大廠商,英特爾和AMD均切入了AI PC市場,非常湊巧的是,兩家均將處理器中的獨立AI模塊最終定名爲NPU(在升級到銳龍8040系列處理器後,AMD將銳龍7040系列中的Ryzen AI引擎升級爲NPU),看似殊途同歸,但兩者的處理器構架和AI佈局方式上還是有一些不同的。
剛纔我提及,帕特•基辛格是業界提出AI PC概念的第一人,其實英特爾早在12代、13代酷睿之上,便通過CPU、GPU、Arc獨顯以及指令集配合軟件與模型的優化實現了不同AI負載的支持;而且通過外接Movidius,可以進一步在終端、邊緣端佈署AI加速能力。這其中,英特爾很早就提出的XPU戰略佔有了極大的先行優勢,OPENVINO在軟件端建立了一個出色的異構計算平臺,能夠讓每一臺PC最大化地利用其AI算力。
早在數月前,我們便看到英特爾在一臺標配內存16GB的13代酷睿的輕薄本上通過Pytorch對指令集的加速和BigDL-LLM框架的優化,便可流暢運行160億參數的大語言模型,並且當時便能基於Xe核芯顯卡以每秒4~5步的高效率運行Stable Diffusion。
另外,英特爾早在第四代英特爾至強可擴展處理器(Sapphire rapids)和首個數據中心GPU Max系列(Ponte Vecchio)上集成了大規模算力,尤其是率先採用Chiplet(小芯片)設計的第四代Intel至強可擴展處理器,在一個封裝上集成多達4個採用Intel 7製程工藝製造的單元(3D封裝技術EMIB帶來的),AI性能相對前代有10倍提升。在雲、邊、端的AI硬件佈局上,英特爾擁有相當明確的前瞻性。
AMD的AI戰略佈局是在銳龍7040系列處理器發佈開始,雖然處理器構架與英特爾不同,但也集成了非常類似的Ryzen AI獨立引擎。兩家雖然在市場競爭上一直對立,但對“AI PC”概念卻是保持了高度的一致性。
AMD在12月7日Advancing AI大會上發佈的銳龍8040系列處理器,出人意料地擠了“牙膏”,8040系列幾乎可以視爲7040系列的馬甲,但在AI引擎上依舊提供了1.6倍的算力提升;據稱,2024年的“Stirx Point”纔是AMD真正提升性能的一代,NPU也會升級到第二代,AI性能預計超過3倍。
深耕PC市場,英特爾的號召力更勝一籌
當AI浪潮以無可阻擋的趨勢到來時,更能看到產業鏈頂端廠商的底蘊所在。在英特爾發佈“AI PC加速計劃”之後,其深耕PC市場、軟硬結合的優勢便顯露出來。在英特爾的技術實力驅動下,酷睿平臺獲得了更多合作伙伴的青睞。
在第一代發佈前,英特爾這一計劃的ISV合作伙伴已經迅速超過100家,已開發的AI加速功能更是超過了300項,絕大部分都是基於NPU開發的;從7040系列到8040系列處理器,AMD也在快速度推進AI功能的適配,據稱其NPU目前已經擁有100多項軟件特性的適配。考慮到英特爾的先發優勢,AMD的速度也不算慢,但還是落後了不少。
AI算力佈局與優化,英特爾構架上佔有優勢
爲何更多ISV會優先選擇英特爾,還是基於剛纔提及的深耕市場和軟硬結合的底蘊,還有一點,便是英特爾在構架上的優勢。雖然英特爾的AMD都在最新處理器中植入了獨立NPU,但剛纔我已經提過,英特爾的XPU構架能夠最大化整合整個處理器的AI能力,讓NPU還可以和CPU、GPU配合,承擔不同的AI負載。事實上,處理器的整體AI算力對未來操作系統來說是非常重要的,據稱微軟的下一代Windows CoPilot(AI助手)的系統性能設計就需要達到40 TOPS,這肯定不是目前單一NPU就能達到的。
在酷睿Ultra沒有發佈之前,雖然我們暫時不知道其NPU的算力多少,但之前披露的信息可知,NPU的效率可以做到CPU的5倍、GPU的近2倍。值得留意的是,AMD由於沒有類似於“XPU”的異構計算佈局,其AI更多通過NPU獨立運行,所以在銳龍8040系列處理器上爲NPU提供了16TOPS算力。
需要說明的是,硬件算力是AI應用的基礎,但並不是決定性要素,PC上展示出的AI能力更多需要ISV和開發者們在軟件端進行優化與適配。比如高通儘管在最新的驍龍X Elite中採用的Hexagon處理器單元中部署了高達45 TOPS的算力,如果ISV和相關開發者支持對其構架支持不夠,但依舊會陷入此前支持不足的泥淖。剛纔提到,英特爾在這方面同樣擁有領先優勢。
寫到最後
AI PC雖然是一個新時代,但無處不考驗處理器廠商的技術深度和創新能力。過去數十年,我們看到英特爾一直在未雨綢繆、提前佈局,不斷創造迅馳、上網本、超極本、Evo筆記本等PC新形態,所以纔有能力在次世代來臨時及時做出轉變。