《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 業(yè)界動態(tài) > 中國電信基于800GWDM現(xiàn)網(wǎng)完成首例千卡分布式無損智算網(wǎng)驗證

中國電信基于800GWDM現(xiàn)網(wǎng)完成首例千卡分布式無損智算網(wǎng)驗證

2024-09-03
來源:IT之家

9月3日消息,當前,隨著智算卡數(shù)達到千卡、甚至萬卡,所需帶寬往往高達百 T 比特級、甚至超 P 比特級。因此,光傳輸系統(tǒng)的大帶寬、高可靠與高效率的特點是保證分布式訓練高算效的關鍵。

中國電信集團宣布,中國電信研究院、中國電信北京公司、天翼云公司共同在中國電信現(xiàn)網(wǎng)基于 800G C+L 技術,為 1024 卡規(guī)模的分布式集群提供大容量帶寬,實現(xiàn) 120 公里千億參數(shù)大模型分布式訓練,性能達到集中訓練的 95% 以上。

據(jù)介紹,針對數(shù)據(jù)傳輸?shù)拇髱拞栴},中國電信采用高階調制格式的單波長 800G 技術以提高頻譜效率,配合當前的業(yè)界熱點的 C+L 波段技術實現(xiàn)超大傳輸帶寬,在中國電信武清與潤澤機房之間采用華為公司傳輸設備,通過多次環(huán)回構建了大帶寬互聯(lián)的智算驗證網(wǎng),距離達到 120km。

針對數(shù)據(jù)傳輸?shù)母呖煽繂栴},中國電信完成了鏈路誤碼、波長故障、光纖故障等異常測試試驗,結果表明,一個 800G 業(yè)務波中斷會導致超 40% 的算效降低,而百毫秒級以上光纖故障會導致算效大幅下降甚至訓練中斷。IT之家從官方獲悉,采用 WSON 重路由恢復技術,此次在兩點間將重路由恢復時間控制在 50ms 以內,可保證分布式智算業(yè)務的高可靠互聯(lián),最大程度釋放算效。

針對傳輸鏈路的高效率問題,中國電信提出分鐘級波長動態(tài)拆建解決方案來實現(xiàn)算與網(wǎng)的協(xié)同分時復用,有效提升網(wǎng)絡資源利用率。此次驗證為跨地域、跨層級、跨主體高可靠的算力協(xié)同調度奠定基礎。


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。