算力如何轉化爲生產力?鄔賀銓院士釋疑

來源:封面新聞

封面新聞記者 滕晗

算力已成爲繼熱力、電力之後的新的生產力。2022中國算力大會公佈的數據顯示,2021年我國算力核心產業規模達1.5萬億,關聯產業規模超過8萬億。

中國工程院院士鄔賀銓(主辦方供圖)

7月30日,中國工程院院士鄔賀銓在會後接受媒體採訪時表達了對“降低算力門檻”的思考,“我們希望算力能夠跟電力一樣‘即插即用’, 但實際上算力跟電力不同,它的使用是需要門檻的,我們希望能夠降低算力的門檻。”

在談到算力基礎設施的國產化情況時,鄔賀銓對封面新聞記者表示,“現在服務器基本上都是國內爲主了,但是服務器裡邊的芯片還是英特爾的可能更多,不過已經看到了像浪潮現在也跟華爲合作。另外,其他芯片如GPU等這些國內也在做,只不過都是小企業在做,目前還成不了主流,所以應該看到我們還是有差距。”

“東數西算”實際上是“東數西存”

鄔賀銓認爲,數據分爲冷數據和熱數據,“熱數據主要是一些需要實時性計算的數據,相比之下冷數據就不需要實時性了,國家的八大算力樞紐,實際上西部主要是處理冷數據,當然還有本地的一些數據,而東部主要是熱數據。”

今年2月,國家發改委、中央網信辦、工業和信息化部、國家能源局聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啓動建設國家算力樞紐節點,並規劃了10個國家數據中心集羣。至此,全國一體化大數據中心體系完成總體佈局設計,“東數西算”工程正式全面啓動。

“人類歷史上90%的數據都是過去幾年產生的,50%是短短兩年產生的,意味着兩年之前的數據肯定都是冷數據,而且兩年之內產生的數據也有很多是冷的。預見到2025年的數據量年均增長30%。最近產生的數據是熱數據,但是熱數據經過一週或者幾個月以後,也要變成冷數據。一般的統計,冷、溫、熱的數據分別佔到80%、15%和5%,也就意味着‘冷’是主要的。冷數據主要是存儲,對冷數據來講,計算不是常態。要這樣算,東西部分別是熱數據和冷數據,照這樣算,‘東數西算’實際上是‘東數西存’,主要存在西邊,當然偶爾會有一些計算。”

“希望能夠降低算力的門檻”

“我們希望算力能夠跟電力一樣‘即插即用’, 但實際上算力跟電力不同,它的使用是需要門檻的,我們希望能夠降低算力的門檻。”鄔賀銓說,算力的使用,首先必須要充分的數據,然後通過數據進行建模,總結出數學模型,才能根據數據計算得出人工智能的決策。

中國人口多,工業門類齊全,理應產生更多的數據。“可是我們雖然產生了很多數據,但真正把它們存儲起來的比例還是不夠高,即便存儲起來的,利用的比例就更低。”鄔賀銓說,將算力轉化爲生產力,首先要從源頭上充分發揮數據的能力,即需要從感知數據、存儲數據利用起來,這就包括鼓勵企業上雲,就企業數字化轉型來說,對大多數中小企業而言,並不需要自己去購買數字化轉型要的IT設備和軟件,“實際上可以上雲,要通過推動雲服務來讓更多企業利用,這樣算力纔能有更好的用武之地。”

同時,還需要有支撐算力發展的產業基礎,包括數據中心、芯片,以及往前端延伸的數據清洗、標註、脫敏等。此外,除IT系統以外,數據中心還包括電力、空調製冷等,因此,如何降低數據中心的能耗,也是值得研究的問題。

“所以國內提出‘東數西算’,利用西部比較充裕的能源,比較廉價的電費,以及有可能利用再生能源,更好滿足低碳的需要。所以發展一個算力產業,實際上產業鏈是相當長的,有很多工作要做,數據中心只是算力產業裡突出的中心環節。”

如何兼顧算力提升與節能減排

節能減排是算力提升進程中繞不開的話題。目前,數據中心的能耗大概佔全社會能耗的2%,不過在鄔賀銓看來,“儘管比例不大,但是相當於一個三峽加一個葛洲壩,也就是說能耗絕對值還是相當可觀的,而且還在增長。”

因此,在建設數據中心時多在強調PUE值,即數據中心消耗的所有能源與IT負載消耗的能源的比值,是評價數據中心能源效率的指標。“現在一般希望能做到1.3,也就是說主要的能耗還在IT上面,數據中心附加的製冷、空調等儘可能降低,當然PUE值低了,仍然不能反應就可以了,因爲我們希望 PUE值的電力最好是來自‘綠色’的,所以還有一個指標叫CUE(環保效率),比如說碳排放,在常規能源情況下,PUE跟CUE是等效的,消耗多少電就排放多少二氧化碳。”鄔賀銓說。

鄔賀銓還指出,“PUE、CUE都降低,也不等於說IT的能耗不需要再進一步降低,IT的能耗其中有服務器裡的能耗,有存儲站的能耗,有網絡站的能耗,數據中心雖然是7×24小時工作,但不是7×24小時計算,很多時間是不計算,但是也耗能,也就是說不僅要降低計算的耗能,還要降低存儲的耗能。”

對此,鄔賀銓建議,針對冷數據可用磁帶代替磁盤,以降低大量能耗,對熱數據,可先用閃存代替硬盤,這樣訪問速度會快,而且能耗也能降低,“只是目前成本要高一點。”

在降低耗能之外,另外一個努力方向應是降低數據中心的散熱,“現在已經提出來用液冷、水冷,甚至有人提出把數據中心泡在水底上、海底上,或者利用自然冷卻,比如挖個山洞,利用山洞的穿堂風等。”鄔賀銓說,不過他也指出,儘管數據中心的能耗值得關注,但還應該看到,數據中心提供的節能效果是它自身產生能耗的20倍。

西部地區應抓住機遇 提供數據中心增值服務

當前,許多地方在加碼佈局數據中心。在鄔賀銓看來,“東數西算”工程的啓動是宏觀層面的引導,“合理佈局數據中心,不要無序建設。”有意引導東部規範熱數據的發展,西部更好地支撐全國的冷數據,“這既是算力的均衡,也是能源的合理利用,更是帶動區域的協同發展。”

鄔賀銓也指出,當前在一個數據中心樞紐裡,各個數據中心的協同仍然不夠,地方政府應該統一協同,至少在公用的能源、電力、水等以及出口的幹線、帶寬上可以更優化,另一個更大的優化是要跨數據中心,“數據中心要備份,那麼主數據中心跟備用數據中心之間,數據就要來往溝通,這裡就要協同,包括設計好它們之間的聯繫線路,幹線傳輸帶寬等。我們還需要在國家層面的對跨域的數據中心協同的規劃部署,當然這還需要一個過程。”

“數據中心更重要不在於建,而在於用。”鄔賀銓強調,值得注意的是,數據中心是重資產,投入後回報比較慢,在西部地區僅靠建數據中心是很難馬上得到回報的,因此,將來的發展方向應該是提供增值服務,包括提供數據的均衡、安全的保障、服務質量的保障,並且西部地區還要延伸到數據前端,“目前,數據的清洗、標註、預處理70%仍然靠人工來完成。西部應該抓住這個機遇。當然數據中心機房也是個產業,有服務器了,安裝、佈線需要大量員工,還有製冷、能源、電力、安防,這些也可以很好地發展,有條件的還可以發展到後端,算法算力的處理等。所以我認爲數據中心的產業鏈現在剛開始,抓住數據中心這個中心環節是對的,但是要延伸到全產業鏈才能發揮它的價值。”