全國政協委員張雲泉接受環球時報專訪:“主權級大模型”需要國家整合資源研發

來源:環球時報

【環球時報報道 記者 趙覺珵】人工智能(AI)大模型的發展日新月異。這一飛速發展、競爭激烈的領域成爲今年兩會不少代表委員的關注點,其中全國政協委員、長期從事超級計算機研發與建設工作的中國科學院計算技術研究所研究員張雲泉將提案聚焦在如何解決大模型算力瓶頸問題上。張雲泉在接受《環球時報》記者專訪時表示,當前國內面臨大模型訓練用國產高端AI芯片供應不足等問題,應該由國家主導、整合優質科研和產業資源,儘快訓練出我國的“主權級”大模型。

在其提交的提案中,張雲泉將大模型描述爲“實現新質智能生產力的重要手段”。他提到,人工智能帶來的效果在現代就像是“核武器”一樣,如果前十年的人工智能技術就像是“原子彈”爲各行各業賦能,大模型技術就像是“氫彈”,將會深刻改變世界思考問題的方式;而芯片就像是“導彈”,有了“導彈”才能投射“原子彈、氫彈”,發揮“實戰”效果。包括Meta公司、軟銀集團、研發GPT的OpenAI等公司都在大模型領域持續發力,其中一些公司計劃自研AI芯片。而在美國封鎖之下,能夠用於大模型訓練的國產智能算力芯片的創新和供應顯著落後,國產多模態大模型的訓練受到美國製裁的影響。

張雲泉說,國內領先的AI芯片廠商因半導體工藝受限或進入美國實體清單的原因,難以使用最新工藝量產所設計的國產芯片,導致大模型訓練用國產高端AI芯片供應不足,生態建設嚴重落後,我們有算法、有數據但沒有合適的算力支撐,大模型這樣的“氫彈”也不能真正發揮出作用。他還認爲,當前國產AI芯片公司缺乏頂層設計,各自爲戰,無法形成合力,延誤了能夠替代英偉達高端訓練GPU的國產AI芯片的儘快推出。此外,大模型落地所需要的配套軟件、服務生態及市場也缺乏投資、引導與建設。

近日,當前大模型訓練用GPU的主要供應商英偉達提出“主權AI”的概念,並將其定義爲“一個國家利用自己的基礎設施、數據、勞動力和商業網絡生產AI的能力”。受“主權AI”概念啓發,張雲泉提出要重視“主權級大模型”的開發。他向《環球時報》記者解釋稱,“主權級大模型”是一個動態概念,它應該是某一時期內最高水平的大模型。這一大模型算力要求最高、智能水平最高,是一個國家AI水平的最高點、基礎大模型的基礎,也可以被形容爲“根模型”。

張雲泉認爲,“主權級大模型”將深刻影響一個國家的科技競爭力,涉及軍事、經濟、政治等多方面能力。“沒有‘主權級大模型’,就像是國家沒有了國防重器,國家就會被打壓,國家安全也會受到威脅”,張雲泉強調,因此必須儘快研製處於國際領先水平的“主權級大模型”,以維護未來的國家安全。

在國產AI芯片研發製造仍需時日的情況下,作爲超算領域的“老兵”,張雲泉建議利用我國在超算研發建設中的豐富積累,設立能夠支持“主權級”多模態大模型訓練的專用超算攻關專項,快速緩解國產“主權基礎大模型”訓練的算力瓶頸。

張雲泉告訴《環球時報》記者,目前大模型使用的GPU最早就是來自超算界。但它在超算上的使用效率不高,卻在深度學習和大模型找到了最佳應用點。大模型訓練用到的很多技術,如大規模並行技術、高速網絡技術、可靠性技術、綠色功耗技術、液冷技術等,中國超算科研人員都已有很成熟的積累,並有較高水平。

在解決AI芯片“卡脖子”的基礎性問題上,張雲泉則建議,集中全國AI芯片研製力量,組建由業內權威專家和各主要AI芯片廠家參加的智能算力發展專項組,通過多輪競爭,確定最優的訓練芯片研發技術路線和國家標準,擇優集中投入資金和優秀人才資源,整合芯片產能,儘快研製出能夠滿足國產主權基礎大模型訓練的十萬卡、百萬卡甚至千萬卡並行算力需求的AI芯片和系統。

“我之所以認爲必須要由國家‘出手’,‘集中力量辦大事’,是因爲國內一些企業往往傾向於使用國外的開源大模型,還經常出現低水平重複與‘內卷’,延誤了‘主權級大模型’的研發”,張雲泉認爲,無論是專用超算攻關專項還是AI芯片攻關專項,都需要國家出面協調資源,統一協調國內優質科研產業資源,以取得快速突破,在智能領域的“核武器”時代佔領先機。“留給我們的時間窗口並不長,不能錯失良機。”