賽道Hyper | AMD AI PC芯片Zen 5架構露真容
作者:周源/華爾街見聞
7月28日,銳龍AI 300筆記本上市。
這款機型之所以受到關注是因爲搭載了AMD全新的AI處理器“銳龍AI 300系列”(4nm工藝製程)。
這個系列的處理器,採用了AMD全新的Zen 5架構。AMD曾在今年6月初的中國臺北國際電腦展上發佈了銳龍AI 300系列和銳龍9000系列兩款桌面AI處理器,並對Zen 5架構做了簡要介紹。
在7月28日搭載了銳龍AI 300系列桌面處理器的筆電上市之前,AMD在美國舉辦的Zen 5 Tech Day技術活動上,披露了這款處理器的詳細技術信息。
Zen 5架構的定製款被稱爲Zen 5c,特徵是更“緊湊”的內核,比標準全功能的Zen 5架構內核小約25%。這兩種內核類型,在同一芯片上,具有不同數量的緩存。這是AMD首次做出這樣的設計。
AMD在2017年推出Zen架構,取代了之前的Bulldozer(推土機)架構:Zen架構的IPC(平均每週期指令)性能比Bulldozer架構提升了52%,遠超預期的40%性能提升值。
在Zen架構推出七年以來,AMD將之迭代了5次。AMD宣稱,新推出的Zen 5架構,比前代Zen 4架構的IPC性能提升了16%,“實現了性能的實質性飛躍”。
AMD做了什麼努力?
簡單來說,AMD做了多項架構改進,包括增加每時鐘週期指令數、拓展指令分派與執行帶寬、翻倍緩存數據帶寬和AI加速等等。比如,通過擴展管道和矢量大小,AMD以此增強Zen 5架構的吞吐能力,這有助於同時處理更多數據並提高核心的並行處理能力。
CPU誕生至今,在設計層面已形成一套成熟的體系。大致上,CPU設計分爲前端和後端兩個環節,物理模塊結構大致包括指令預取與解碼、整數執行、浮點執行、載入存儲和緩存等不同的單元。
Zen 5架構提升了前端的部分模塊的規格,比如從1提升到1.5:AMD設計了雙預取、雙解碼流水線和提升一倍的指令帶寬等(前端)。
其中,前端帶寬指令翻番,有助於提高處理器處理複雜計算和數據密集型任務的效率。這個新設計,也體現在L1和L2緩存之間,以及增加了L1緩存到浮點(FP)單元的數據傳輸速率。
Zen 5架構的浮點與矢量執行單元部分,在Zen 4架構引入AVX-512指令集的基礎上,從僅支持256位數據寬度,強化爲支持完整的512位;L1緩存容量也從32KB增大到48KB,同時從8路增強爲12路。
面對如今洶涌澎湃的AI算力和應用需求,Zen 5架構大幅提升了數學加速單元的性能:單核執行數學學習提速最高至32%,AES-XTS指令提速最多至35%。
正因爲有了這些技術努力,故而Zen 5架構的IPC性能可提升16%,在有些場景中,甚至能提升35%。
AMD稱Zen 5架構整體性能比前代提升幅度“巨大”,是否誇張?
華爾街見聞查閱了Zen架構之前四次迭代的性能提升幅度後發現,這個措辭多少有些誇張。Zen+、Zen 2、Zen 3和Zen 4各自比前代的性能提升幅度分別是3%、15%、19%和13%。這次是16%,不如Zen 3的性能升幅。
但這並沒有影響Zen 5架構的技術創新和由此帶來的AI性能表現。這是一款符合AI需求的桌面處理器,而採用Zen 3架構的處理器並未具備這些新的技術優勢。
7月28日上市的搭載銳龍AI 300系列處理器的筆記本電腦,有Zen 5和Zen 5c兩種規格。
這兩款處理器採用了完全相同的CPU架構,不同之處是什麼?Zen 5c屬於定製款,相對來說,因爲採用“緊湊型”設計,因此相對Zen 5架構,Zen 5c架構的緩存更小,頻率也更低,但能效更高,更符合移動場景需求。
作爲一款AI PC處理器,銳龍AI 300系列也採用異構設計,即CPU+GPU+NPU。其中,CPU架構升級到了Zen 5,GPU則採用了RDNA 3.5架構,NPU用了XDNA 2架構。其中,RDNA 3.5架構主要提升了能效比、內存性能和電池續航。
NPU部分,XDNA 2架構將AI引擎單元從20個增加到32個(分四行八列)),每個單元內的MAC數量翻倍;疊加板載內存容量增加的1.6倍、支持Block FP16塊狀浮點格式、非線性增強支持和8條併發空間流(比前代架構實現翻倍),故而銳龍AI 300系列的NPU算力,高達50 TOPS。
這個指標,在全球範圍內,超越了頭部同類競品:Intel Lunar Lake(48 TOPS)、高通驍龍X Elite(45 TOPS)、蘋果M4(38 TOPS)。