☰

賽道Hyper | AMD AI PC芯片Zen 5架構露真容

作者：周源/華爾街見聞

7月28日，銳龍AI 300筆記本上市。

這款機型之所以受到關注是因爲搭載了AMD全新的AI處理器“銳龍AI 300系列”（4nm工藝製程）。

這個系列的處理器，採用了AMD全新的Zen 5架構。AMD曾在今年6月初的中國臺北國際電腦展上發佈了銳龍AI 300系列和銳龍9000系列兩款桌面AI處理器，並對Zen 5架構做了簡要介紹。

在7月28日搭載了銳龍AI 300系列桌面處理器的筆電上市之前，AMD在美國舉辦的Zen 5 Tech Day技術活動上，披露了這款處理器的詳細技術信息。

Zen 5架構的定製款被稱爲Zen 5c，特徵是更“緊湊”的內核，比標準全功能的Zen 5架構內核小約25%。這兩種內核類型，在同一芯片上，具有不同數量的緩存。這是AMD首次做出這樣的設計。

AMD在2017年推出Zen架構，取代了之前的Bulldozer（推土機）架構：Zen架構的IPC（平均每週期指令）性能比Bulldozer架構提升了52%，遠超預期的40%性能提升值。

在Zen架構推出七年以來，AMD將之迭代了5次。AMD宣稱，新推出的Zen 5架構，比前代Zen 4架構的IPC性能提升了16%，“實現了性能的實質性飛躍”。

AMD做了什麼努力？

簡單來說，AMD做了多項架構改進，包括增加每時鐘週期指令數、拓展指令分派與執行帶寬、翻倍緩存數據帶寬和AI加速等等。比如，通過擴展管道和矢量大小，AMD以此增強Zen 5架構的吞吐能力，這有助於同時處理更多數據並提高核心的並行處理能力。

CPU誕生至今，在設計層面已形成一套成熟的體系。大致上，CPU設計分爲前端和後端兩個環節，物理模塊結構大致包括指令預取與解碼、整數執行、浮點執行、載入存儲和緩存等不同的單元。

Zen 5架構提升了前端的部分模塊的規格，比如從1提升到1.5：AMD設計了雙預取、雙解碼流水線和提升一倍的指令帶寬等（前端）。

其中，前端帶寬指令翻番，有助於提高處理器處理複雜計算和數據密集型任務的效率。這個新設計，也體現在L1和L2緩存之間，以及增加了L1緩存到浮點（FP）單元的數據傳輸速率。

Zen 5架構的浮點與矢量執行單元部分，在Zen 4架構引入AVX-512指令集的基礎上，從僅支持256位數據寬度，強化爲支持完整的512位；L1緩存容量也從32KB增大到48KB，同時從8路增強爲12路。

面對如今洶涌澎湃的AI算力和應用需求，Zen 5架構大幅提升了數學加速單元的性能：單核執行數學學習提速最高至32%，AES-XTS指令提速最多至35%。

正因爲有了這些技術努力，故而Zen 5架構的IPC性能可提升16%，在有些場景中，甚至能提升35%。

AMD稱Zen 5架構整體性能比前代提升幅度“巨大”，是否誇張？

華爾街見聞查閱了Zen架構之前四次迭代的性能提升幅度後發現，這個措辭多少有些誇張。Zen+、Zen 2、Zen 3和Zen 4各自比前代的性能提升幅度分別是3%、15%、19%和13%。這次是16%，不如Zen 3的性能升幅。

但這並沒有影響Zen 5架構的技術創新和由此帶來的AI性能表現。這是一款符合AI需求的桌面處理器，而採用Zen 3架構的處理器並未具備這些新的技術優勢。

7月28日上市的搭載銳龍AI 300系列處理器的筆記本電腦，有Zen 5和Zen 5c兩種規格。

這兩款處理器採用了完全相同的CPU架構，不同之處是什麼？Zen 5c屬於定製款，相對來說，因爲採用“緊湊型”設計，因此相對Zen 5架構，Zen 5c架構的緩存更小，頻率也更低，但能效更高，更符合移動場景需求。

作爲一款AI PC處理器，銳龍AI 300系列也採用異構設計，即CPU+GPU+NPU。其中，CPU架構升級到了Zen 5，GPU則採用了RDNA 3.5架構，NPU用了XDNA 2架構。其中，RDNA 3.5架構主要提升了能效比、內存性能和電池續航。

NPU部分，XDNA 2架構將AI引擎單元從20個增加到32個（分四行八列)），每個單元內的MAC數量翻倍；疊加板載內存容量增加的1.6倍、支持Block FP16塊狀浮點格式、非線性增強支持和8條併發空間流（比前代架構實現翻倍），故而銳龍AI 300系列的NPU算力，高達50 TOPS。

這個指標，在全球範圍內，超越了頭部同類競品：Intel Lunar Lake（48 TOPS）、高通驍龍X Elite（45 TOPS）、蘋果M4（38 TOPS）。

相關資訊