《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 重大技術(shù)突破 中國(guó)新一代神威超算大顯身手

重大技術(shù)突破 中國(guó)新一代神威超算大顯身手

2025-10-24
來(lái)源:芯智訊

10月23日消息,據(jù)外媒vastdata報(bào)道,中國(guó)科學(xué)家已經(jīng)成功使用自研的人工智能模型和新一代E級(jí)(百億億次)超級(jí)計(jì)算機(jī)——神威·海洋之光(Oceanlite)在真實(shí)分子的尺度上對(duì)復(fù)雜的量子化學(xué)進(jìn)行建模,這是一項(xiàng)重大的技術(shù)突破。相關(guān)研究成果已經(jīng)發(fā)表在了IEEE官網(wǎng)上。

97884.png

通常,很多科學(xué)研究的模擬是在超級(jí)計(jì)算機(jī)上進(jìn)行的,因?yàn)樗鼈冃枰薮蟮挠?jì)算。還有一些類型的研究——例如模擬具有指數(shù)級(jí)更多相互作用態(tài)的分子的量子行為——這就需要算力更強(qiáng)的量子計(jì)算機(jī)來(lái)模擬它們(但是目前量子計(jì)算機(jī)并不成熟),或者將其簡(jiǎn)化以使任務(wù)適合現(xiàn)代超級(jí)計(jì)算機(jī)。

量子力學(xué)中的量子態(tài)——由波函數(shù) (Ψ) 描述——這決定了量子系統(tǒng)的所有可能配置,例如分子中電子等粒子的位置、自旋或能級(jí),以及它們的概率。對(duì)其進(jìn)行建模具有挑戰(zhàn)性,因?yàn)榭臻g狀態(tài)隨著粒子數(shù)量的增加呈指數(shù)級(jí)增長(zhǎng),這使得在我們今天使用的經(jīng)典超級(jí)計(jì)算機(jī)上進(jìn)行模擬幾乎是不可能的。

為此,科學(xué)家們使用各種近似方法來(lái)簡(jiǎn)化量子方程,同時(shí)保持描述分子結(jié)構(gòu)、反應(yīng)和能量的準(zhǔn)確性。然而,近似波函數(shù)的現(xiàn)有方法的縮放僅限于小分子。

雖然這種量子多體系統(tǒng)可以用神經(jīng)網(wǎng)絡(luò)方法求解,但神經(jīng)網(wǎng)絡(luò)量子態(tài)(NNQS)在大規(guī)模電子結(jié)構(gòu)分析中的實(shí)際部署面臨著挑戰(zhàn),主要是采樣成本高和局部能量計(jì)算的復(fù)雜性。

為了克服這些計(jì)算障礙,中國(guó)的科學(xué)家提出了一種創(chuàng)新的數(shù)據(jù)并行 NNQS-Transformer 實(shí)現(xiàn)方案。他們對(duì) 120 個(gè)自旋軌道系統(tǒng)進(jìn)行實(shí)驗(yàn),模擬訓(xùn)練了神經(jīng)網(wǎng)絡(luò)來(lái)近似分子的波函數(shù),確定電子最有可能在哪里。對(duì)于每個(gè)采樣的電子排列,系統(tǒng)計(jì)算局部能量并調(diào)整網(wǎng)絡(luò),直到其預(yù)測(cè)與分子的真實(shí)量子能量模式相匹配。

中國(guó)的科學(xué)家通過(guò)定制的NNQS-Transformer模型與基于申威(Sunway)SW26010-Pro CPU的神威·海洋之光超級(jí)計(jì)算機(jī)結(jié)合,實(shí)現(xiàn)了在包含多達(dá) 120 個(gè)自旋軌道的系統(tǒng)上的全面的量子化學(xué)計(jì)算。

具體來(lái)說(shuō),SW26010-Pro是SW26010改進(jìn)型,擁有6個(gè)核心模塊和 1 個(gè)協(xié)議處理單元(PPU)構(gòu)成,每個(gè)模塊有1個(gè)管理Linux線程的核心(MPE)和64個(gè)計(jì)算核心,總計(jì)384 個(gè)內(nèi)核,相比之下上一代的SW26010 只有 4 個(gè)核心組,說(shuō)明SW26010 pro單芯片應(yīng)該有50%的性能提升。

1_97884.jpg

SW26010-Pro處理器的384個(gè)計(jì)算核心當(dāng)中,每64個(gè)(8×8)計(jì)算核心網(wǎng)絡(luò)組成一個(gè)具有256KB L2高速緩存的計(jì)算處理單元(CPE)。每個(gè)CPE有四個(gè)邏輯塊,可以在一對(duì)上支持FP64和FP32,在另一對(duì)上則可以支持FP16和BF16。

研究人員設(shè)計(jì)了一種分層通信模型,其中管理核心負(fù)責(zé)處理器和節(jié)點(diǎn)之間的協(xié)調(diào),而數(shù)百萬(wàn)個(gè)具有512 bit矢量引擎的“輕量級(jí)”2-wide計(jì)算處理單元(CPE)執(zhí)行本地量子計(jì)算。此外,他們還創(chuàng)建了一個(gè)動(dòng)態(tài)負(fù)載平衡算法,以確保不均勻的計(jì)算負(fù)載不會(huì)使任何內(nèi)核空閑。

最終,中國(guó)的科學(xué)家們?cè)谏裢ずQ笾獾?700萬(wàn)個(gè)處理器核心(神威·海洋之光最大的配置超過(guò)100000個(gè)節(jié)點(diǎn),共有超過(guò)4100萬(wàn)個(gè)核心,F(xiàn)P16性能超過(guò)5 Exaflop/s,F(xiàn)P64的理論峰值性能為1.5 Exaflops)上運(yùn)行了他們的代碼,實(shí)現(xiàn)了92%的強(qiáng)擴(kuò)展性和98%的弱擴(kuò)展性,對(duì)于這樣的規(guī)模來(lái)說(shuō),這是一個(gè)很高的效率,這突顯了開發(fā)人員已經(jīng)找到了軟件和硬件之間近乎完美的同步,這是中國(guó)超級(jí)計(jì)算機(jī)界的一項(xiàng)重大成就。

迄今為止,對(duì)具有120個(gè)自旋軌道的分子系統(tǒng)的模擬,是有史以來(lái)在經(jīng)典超級(jí)計(jì)算機(jī)上進(jìn)行的最大的人工智能驅(qū)動(dòng)的量子化學(xué)計(jì)算,這標(biāo)志著使 NNQS 計(jì)算在現(xiàn)實(shí)世界的量子化學(xué)應(yīng)用中實(shí)用化邁出了關(guān)鍵一步,也標(biāo)志著中國(guó)在該領(lǐng)域的重大技術(shù)突破。


subscribe.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。