《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 新品快遞 > 安謀科技發(fā)布NPU IP“周易”X3

安謀科技發(fā)布NPU IP“周易”X3

驅(qū)動架構(gòu)革新再定義端側(cè)AI
2025-11-17
來源:安謀科技
關(guān)鍵詞: 安謀科技 NPU AI

2025年11月13日,安謀科技Arm China在上海隆重發(fā)布新一代NPU IP“周易”X3。作為專為大模型時代打造的尖端產(chǎn)品,采用革命性的DSP+DSA混合架構(gòu),具備全面精度支持與多項自研硬件加速技術(shù),致力于為智能汽車、移動終端、智能物聯(lián)網(wǎng)等關(guān)鍵領(lǐng)域注入強大AI算力,提升端側(cè)計算效率,推動邊緣AI規(guī)模化部署。

11.jpg


一、架構(gòu)革新:專為大模型而生,開啟浮點計算新紀(jì)元

“周易”X3的核心突破在于其底層架構(gòu)的徹底革新。它采用了專為應(yīng)對復(fù)雜大模型計算挑戰(zhàn)而設(shè)計的最新DSP+DSA架構(gòu),實現(xiàn)了從傳統(tǒng)定點計算向高性能浮點計算的關(guān)鍵跨越。該架構(gòu)支持靈活的算力配置,單計算集群Cluster可提供高達(dá)8-80 FP8 TFLOPS的算力,同時單核心Core帶寬飆升至256GB/s,為數(shù)據(jù)密集型的大模型應(yīng)用提供了堅實的數(shù)據(jù)吞吐保障。

尤為關(guān)鍵的是,“周易”X3原生支持了端側(cè)高效運行大模型所必需的W4A8與W4A16計算加速模式。通過對模型權(quán)重進(jìn)行低比特量化,有效大幅降低了內(nèi)存帶寬消耗,打通了云端大模型向資源受限的端側(cè)設(shè)備高效遷移的技術(shù)路徑。

12.jpg


二、性能飛躍:算力密度與效率雙提升,大模型能力激增十倍

得益于架構(gòu)的根本性升級,“周易”X3在性能上實現(xiàn)了質(zhì)的飛躍。官方數(shù)據(jù)顯示,相較于前代“周易”X2,新一代“周易”X3在處理廣泛應(yīng)用的CNN模型時,性能提升高達(dá)30%至50%。更為驚人的是,在相同算力規(guī)格下,其AIGC大模型處理能力實現(xiàn)了10倍級的跨越式增長。這一驚人表現(xiàn),源于其16倍的FP16 TFLOPS算力提升、4倍的計算核心帶寬增長,及超過10倍的Softmax和LayerNorm關(guān)鍵運算性能強化。實測標(biāo)明,多核協(xié)同工作的算力線性度達(dá)到了優(yōu)異的70%-80%,確保了算力的高效利用。

在實際大模型推理測試中,“周易”X3的表現(xiàn)同樣耀眼。在運行Llama2 7B等主流大模型時,其預(yù)填充Prefill階段的算力利用率高達(dá)72%,而在關(guān)鍵的解碼Decode階段,在安謀科技自研解壓硬件WDC的加持下,有效帶寬利用率更是突破了100%,遠(yuǎn)超行業(yè)平均水平,充分釋放了硬件的潛在算力,為大模型在端側(cè)的流暢運行提供了極致性能保障。

13.jpg


三、關(guān)鍵技術(shù)突破:四大核心引擎,精準(zhǔn)破解端側(cè)AI難題

“周易”X3并非簡單的性能堆砌,而是通過一系列集成化的硬件創(chuàng)新,精準(zhǔn)解決了端側(cè)部署AI大模型面臨的帶寬、調(diào)度、精度適配等核心難題。

“周易”X3搭載自研解壓硬件WDC,創(chuàng)新性地集成了權(quán)重解壓硬件單元,支持對大模型權(quán)重進(jìn)行軟件無損壓縮后直接硬件解壓,帶來約15%的等效帶寬提升,有效緩解了內(nèi)存墻壓力。同時,集成的AI專屬硬件引擎AIFF與專用硬化調(diào)度器,將CPU負(fù)載降至0.5%以下,并顯著降低了任務(wù)調(diào)度延遲。這使得NPU在并行處理多路AI任務(wù)時,即使在高優(yōu)先級任務(wù)需即時響應(yīng)的復(fù)雜場景下,仍能保持系統(tǒng)流暢高效運行。

“周易”X3還支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合計算與強浮點運算能力。憑借其全面的整數(shù)與浮點計算支持,該NPU IP能夠無縫適配從傳統(tǒng)CNN模型到前沿Transformer大模型的多樣化計算需求,在智能手機邊緣推理、AI PC、智能汽車等不同應(yīng)用中實現(xiàn)性能與能效的精準(zhǔn)平衡。此外,新增的端側(cè)大模型必備W4A8/W4A16計算加速模式,可對模型權(quán)重進(jìn)行低比特量化,大幅降低帶寬消耗,有效支持云端大模型向端側(cè)的高效遷移。

14.jpg


寫在最后

安謀科技Arm China “周易”X3 NPU IP的發(fā)布,標(biāo)志著端側(cè)AI計算能力邁上了一個全新臺階。其兼具高性能、高能效與高靈活性的特點,將直接賦能智能汽車、移動終端、智能物聯(lián)網(wǎng)、基礎(chǔ)設(shè)施等領(lǐng)域。配合其成熟易用的“周易”NPU Compass AI軟件平臺,構(gòu)成了一個完整的軟硬件一體化解決方案,將極大降低開發(fā)門檻,推動創(chuàng)新AI應(yīng)用在各行各業(yè)的快速孵化和部署。


訂閱網(wǎng)站文章尾圖1.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。