《電子技術應用》
您所在的位置:首頁 > 人工智能 > 业界动态 > 华为发布全新AI数据基础设施

华为发布全新AI数据基础设施

加速全场景推理体验升级
2026-03-18
來源:C114通信网

3月17日,在2026華為數(shù)據存儲新春發(fā)布會上,華為正式發(fā)布針對AI推理場景的全新AI數(shù)據基礎設施,包含面向中心推理場景的AI數(shù)據平臺,和面向分支邊緣推理場景的FusionCube A1000 AI超融合一體機,旨在推動AI推理體驗全面升級,并顯著降低推理部署門檻,加速AI商業(yè)正循環(huán)。

過去幾年,AI歷經多輪演進,已邁入了以推理為核心的全新階段。當下,企業(yè)正面臨兩大變化:一是數(shù)據類型與規(guī)模持續(xù)擴展,從文本為主轉向多模態(tài)格式混合,體量從TB級躍升至EB級;二是企業(yè)核心資產從“數(shù)據”轉變?yōu)椤爸R”與“記憶”,被實時調用以支撐智能體自主決策。這些正全面重塑AI數(shù)據基礎設施,成為AI行業(yè)化落地的關鍵。

面向中心推理場景,華為推出AI數(shù)據平臺

為解決推理業(yè)務中知識質量不足、長序列推理體驗差以及推理記憶缺失的三大瓶頸,華為發(fā)布AI數(shù)據平臺,整合知識庫、KV Cache加速和記憶庫,并結合UCM技術實現(xiàn)調度與管理,破除企業(yè)AI的數(shù)據門檻,加速智能體應用落地。

知識庫:實時生成知識、高精度檢索知識

企業(yè)數(shù)據在不斷變化與更新,如果知識轉化不及時,會導致模型的推理決策結果不精準。華為AI數(shù)據平臺采用端到端的解析優(yōu)化、表征優(yōu)化與檢索優(yōu)化,提供一個可敏銳捕捉源端數(shù)據變化的AI數(shù)據管道,并通過多模無損解析、Token級編碼等方式,將文本、圖片、視頻等資源轉化成海量細顆粒度的知識,結合多維度檢索與重排序,實現(xiàn)超95%知識檢索精度。

KV Cache加速:容納海量歷史數(shù)據,加速推理響應

在長文本長序列、多用戶多并發(fā)的推理過程中,大量的KV Cache數(shù)據存不下、系統(tǒng)響應遲緩,導致推理體驗惡化。華為AI數(shù)據平臺針對性提供了全局分層緩存能力,讓記憶數(shù)據在On-chip memory、DRAM、外置SSD存儲三層間按需流動,顯著擴充KV Cache存儲池,同時融合多種稀疏注意力算法,避免重復計算,大幅擴展上下文窗口,實現(xiàn)首Token時延降低90%。

記憶庫:高效管理上下文記憶,讓模型越用越聰明

當前,大模型普遍缺乏持久的記憶,會遺忘多步驟的中間結果和長期沉淀的歷史經驗,無法真正實現(xiàn)自我進化。華為AI數(shù)據平臺提供精準的記憶萃取與召回能力,實現(xiàn)上下文狀態(tài)保持、信息凝練。記得越多,推理就越精準,模型應用才能“越用越聰明”。

本次發(fā)布的AI數(shù)據平臺可提供一體化和獨立式兩大部署模式。一體化部署以OceanStor A800為全棧一體機底座;獨立式部署采用“數(shù)據引擎節(jié)點+OceanStor Dorado”架構,可在現(xiàn)有存儲系統(tǒng)上新增數(shù)據引擎節(jié)點,保護歷史投資,支撐業(yè)務平滑轉型。

面向分支邊緣推理場景,華為發(fā)布FusionCube A1000 AI超融合一體機

如今,大量的數(shù)據是在分支邊緣場景產生的,針對傳統(tǒng)分支邊緣場景進行智能化改造過程中所面臨的部署復雜、成本高昂、效率低下等問題,華為推出FusionCube A1000 AI超融合一體機,通過集成化與智能化交付,助力AI快速部署與高效運行。

FusionCube A1000采用通算與智算融合一體化架構,實現(xiàn)AI部署“開箱即用”。其內置的AI平臺預集成了數(shù)據處理、模型訓練與推理全流程能力,基礎設施部署與應用上線周期顯著縮短80%。同時,F(xiàn)usionCube A1000具備統(tǒng)一運維、安全運營的能力,實現(xiàn)全棧管理、健康監(jiān)測、故障快速定位定界,為智能體穩(wěn)定高效地運行提供安全保障。

此外,F(xiàn)usionCube A1000支持邊緣與中心協(xié)同運行,打破數(shù)據孤島,形成智能體從感知到自主決策的閉環(huán)。分支邊緣側產生的數(shù)據將回傳至中心,在中心側不斷豐富語料、完成模型增訓,模型更新后可一鍵下發(fā)至邊緣側,實現(xiàn)模型能力的持續(xù)優(yōu)化與共享。同時,F(xiàn)usionCube A1000支持算力的動態(tài)切分與調度,可同時運行多個不同的AI模型,并依據業(yè)務優(yōu)先級智能分配資源,單卡算力利用率提升約30%。其內置平臺還支持知識庫與記憶庫的協(xié)同構建,數(shù)據飛輪無感運轉,持續(xù)提升AI模型輸出的準確性與實用性。

此次發(fā)布的華為AI數(shù)據平臺與FusionCube A1000,實現(xiàn)了從中心到邊緣的AI推理全場景覆蓋,為AI技術廣泛行業(yè)化落地注入新動能。華為數(shù)據存儲將持續(xù)深耕創(chuàng)新,賦能AI全路徑,助力企業(yè)兌現(xiàn)AI商業(yè)價值。

2.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。