中國聯通唐雄燕:智算互聯網的技術與實踐
(原標題:中國聯通唐雄燕:智算互聯網的技術與實踐)
[中國,上海,2024年6月27日] 在2024MWC上海期間,以“擁抱Net5.5G,加速邁向智能化時代”爲主題的產業峰會成功舉辦,該峰會由共熵產業與標準創新服務中心主辦,旨在推動下一代網絡Net5.5G的全球共識,加速應用部署落地。會上,中國聯通研究院副院長、首席科學家唐雄燕發表了《智算互聯網的技術與實踐》的主題演講。
唐雄燕表示,算力是當前數字經濟高質量發展進程中不可或缺的生產要素和關鍵生產力。“2023年我國數字經濟規模達56.1萬億元,總量穩居世界第二,佔GDP比重提升至44%,數字經濟成爲穩增長促轉型的重要引擎”,“以大模型爲代表的人工智能產業發展對算力基礎設施提出了更大挑戰,包括算力、運力及存力等方面。”因此,在算力地位提升的當下,應該着力建設包括網絡和算力在內的數字基礎設施。
深耕AI算力,加快智能算力基礎設施建設,將有效促進AI創新和規模化應用。唐雄燕指出“智算互聯是增強智算能力的重要手段”。深入實施“東數西算”工程,構建聯網調度、普惠易用、綠色安全的全國一體化算力網,助力網絡強國、數字中國建設,打造中國式現代化的數字基座。同時,東數西算帶來海量數據傳輸的需求,在智算與超算業務場景下,TB 級海量數據通過傳統的網絡帶寬傳輸時效性難以滿足要求,通過更高速率的專線傳輸則成本過高,海量數據高效無損傳輸一直是業界難題。因此需要構建多樣化手段的網絡,在此基礎上來滿足東數西算的發展,匯聚和共享算力、數據、應用資源。基於此,中國聯通提出了要發展智算互聯網,智算互聯網的關鍵能力是“高通量、高性能、高智能”的三高特徵,如何保證高通量,這就要求網絡通過廣域RDMA無損、彈性高通量等技術,構建支持無損傳輸的大帶寬高通量運力網絡,在數據中心內部帶寬需求很大,但是廣域網要考慮經濟性,不可能跟數據中心是同樣的帶寬,因此要求廣域DCI收斂模型建網,在滿足訓練效率90%的條件下,與計算協同,選取合適的廣域收斂比和訓練效率平衡最優建網; 在網絡高性能上要做到低時延,則要求網絡扁平化、可以做到智算池間一跳直達、逼近物理時延,廣域網的海量網元構成超大規模組網以應對計算任務的快速增長,最後,要求網絡高智能,智算網絡對動態和彈性的靈活部署與運營要求非常高,一定要把智能化引入到網絡中來,實現網絡的自動駕駛。
唐雄燕介紹到,廣域網是運營商提供的基礎網絡服務的責任,隨着人工智能技術的不斷髮展,大模型訓練的規模和複雜度也在不斷增加。當前大模型訓練包括入算、算間、推理三種業務。智算廣域目標網能夠爲分佈在不同地域的算力資源統一調度提供網絡服務,其包括算網大腦、算力網關層、基礎網絡層三部分,可以爲智算業務提供四大能力:
高吞吐:通過流量智能分擔,實現帶寬的均衡負載,通過廣域高吞吐,實現數據的無損傳輸和保障,降低算力資源的損耗;
高彈性: 通過分鐘級建聯,實現算力資源的快速接入和連接;通過低時延彈性入算,實現算力資源的動態擴縮和調整;
高保障:基於仿真的業務准入控制,大數據傳輸時間可承諾;
高安全:端到端加密業務極簡部署,線速加密,訓練樣本0泄露;
唐雄燕進一步強調了面向算力時代的萬物智聯需求,“IPv6+”在算網協同中的重要作用,從廣聯接、超帶寬、自動化、確定性、低時延和安全六個維度全面提升IP網絡能力,打造中國主導、全球適用的IPv6演進技術體系。
唐雄燕介紹到,基於上述關鍵技術的研究和創新,中國聯通進一步構建面向東數西存/東數西訓的高通量數據網,打造任務式高速數據快遞服務產品,面向數字經濟時代算網融合新要求,中國聯通積極構建算力豐富、運力充沛、多雲協同、算網一體的算力網絡。具體爲,通算佈局:打造全面覆蓋“東數西算”場景的“5+4+31+X”雲網邊一體化多層級算力佈局,加快“聯通雲”發展。智算佈局:按照“規劃先行、市場驅動、適度超前、小步快跑”的總體原則,統籌規劃“1+N+X”佈局全國智算資源池,包括“1”個超大規模智算訓練中心、“N”個智算訓推一體節點、“X”個屬地化智算推理節點;算力網絡:全光底座+“IPv6+”算力承載網。
最後,唐雄燕表示,Net5.5G已成爲產業共識,作爲數字經濟的重要基礎設施,對提升國家競爭力和企業競爭力具有重要意義,中國聯通將積極擁抱Net5.5產業代際變革,聯合設備商、應用開發者等各方面共同推進Net5.5G的商業實踐。