國內AI研究頂不了天、落不了地,李國傑院士文章什麼是基礎研究?

機器之心報道

機器之心編輯部

近段時間,谷歌旗下 AI 公司 DeepMind 開發的 AlphaFold 2 在蛋白質預測領域接連迎來重大進展和突破。7 月 15 日,該公司在 Nature 發文表示 AlphaFold 預測的蛋白質結構已經能夠達到原子水平的準確度,並正式開放了 AlphaFold 2 的源代碼。

之後不久,DeepMind 再次在 Nature 上發文稱他們已經使用新開發的 AlphaFold 預測出了 35 萬種蛋白質的結構,並與歐洲生物信息研究所合作建立 AlphaFold 蛋白質結構數據庫,將預測結果免費開放給公衆。這將涵蓋 98.5% 的幾乎所有人類蛋白。

AlphaFold 2 在蛋白質預測領域的一系列重大進展吸引了國內科研人員的高度關注,並引發了他們對國內基礎研究、理論研究和應用研究現狀的反思。

近日,中國工程院院士、中科院計算所首席科學家李國傑在科學網撰寫的文章《國內 AI 研究「頂不了天、落不了地」,該想想了》刷屏了各大平臺,這是他在谷歌 AlphaFold 取得巨大成果之後對國內 AI 研究的一次深入思考。在文中,李國傑院士主要表達了以下幾個核心觀點:

第一,他認爲蛋白質摺疊問題的解決是生物學界和人工智能界長期合作努力的結果,但 AlphaFold 2 的「臨門一腳」是取得勝利的標誌性突破,它用精確的預測結果顯示出 AI 技術在基礎科研上的巨大威力。AlphaFold 2 的巨大成功給了我們許多耐人尋味的啓示。

第二,雖然我們在國家層面已經高度重視 AI 技術的發展,開展了數據智能、量子智能計算、類腦智能燈基礎理論研究,近年來也發表了大量的 AI 論文和專利等,取得了一些顯著的 AI 落地成果。但他認爲,我們的研究多數是技術驅動、論文導向,目標導向和問題導向的研究較少。

第三,在選擇科研課題時,他表示:「我們與一流科學家的差距之一是選擇可突破的重大科學問題的眼光不夠敏銳,佈局的科研項目要麼是增量式的技術改進,要麼是幾十年都難以突破的理想型目標。」谷歌研究者在利用 AI 預測蛋白質摺疊結構上就充分體現了這種超前的預見性。他還認爲使用機器學習的方法全自動地做集成電路的前端和後端設計也有可能在十年左右的時間裡取得突破。

第四,AI 學者對人工智能的理解可能出現了偏差,一直以來都在追求機器「像不像人」這個目標,AI 研究普遍存在着模仿人、替換人的思想束縛。但是他認爲「理性的人工智能發展模式應該承認人有人智,機有機「智」,要充分發揮機器「思維」的特長,做人不擅長做的事情。」

第五,AlphaFold 的重大突破得益於跨學科科研人員的緊密合作,比如機器學習、計算機視覺、自然語言處理、分子動力學、生命科學、高能物理、量子化學。他認爲基於最基礎科學原理的機器學習需要人類多領域科學家的智慧和機器『智能』有機融合,並將「數據密集型科學發現」作爲科研第五範式的雛形。

第六,AlphaFold 的成果並沒有提出新的科學原理,更像是一項技術集成工作,本質上是一種集成式的工程科學技術。因此,他認爲「工程科學技術不只是工具,也不僅僅是基礎研究成果的應用,而是在基礎研究中可以發揮巨大作用的重要組成部分。」

第七,他認爲,目前我國大學和企業的人工智能實驗室大多遇到頂天頂不了、立地又落不下去的困境。

李國傑院士的這篇文章可以使我們瞥見國內 AI 研究與國外的一些差異以及存在的一些問題,也爲今後 AI 的發展道路提供一些可借鑑之處。

對此,中國科學院計算技術研究所研究員、博士生導師包雲崗也在知乎發表了文章,表達了他對基礎研究的一些看法。經包雲崗本人授權,機器之心對他的觀點進行了不改變原意的整理。

包雲崗關於基礎研究的看法

包雲崗主要從基礎研究的定義、基礎研究的具化、自研平臺 / 材料 / 試劑 / 設備 / 儀器等基礎設施對基礎研究的作用以及基礎研究的管理與組織四個方面闡述了他的觀點。

選擇合適的「基礎研究」的定義

對於基礎研究的不同定義,對應的具體實施方式也不同。過去幾十年,主要有兩種對研究的定義:

個人更青睞 Stokes 的四象限模型。對於一個國家而言,「玻爾象限」、「巴斯德象限」和「愛迪生象限」都不可或缺,但其比例應該是隨着時代變化而有所調整的。比如二戰期間,美國的哈佛大學、耶魯大學也都是以愛迪生象限爲主,哈佛教授都在爲美國海軍研製新型魚雷。但二戰後巴斯德象限比例則顯著提高。

中國的科研在這三個象限的比例還沒有測算過,但我判斷巴斯德象限還是偏低的。也許現在這個時局下,國家總體上還是應該有規劃地提高巴斯德象限的比例。那需求來自哪裡?「四個面向」給出了大方向。以面向經濟主戰場爲例,以華爲、阿里等爲代表的業界領軍企業的需求,就是一種很好的牽引。

基礎研究可簡化定義爲「把問題的底層原理搞清楚」

其實波爾象限與巴斯德象限,在具體科研實踐時其實是一樣的,就是「把問題的底層原理搞清楚」,只是問題的來源有所不同。波爾象限的問題來源主要來自學科自身,如爲什麼會有量子糾纏現象;而巴斯德象限的問題來源主要來自現實應用,如爲什麼牛奶會腐敗。

從這個角度來看,只要能提出一些未解的問題,那就有潛力做出好的基礎研究工作。

高度重視自研的平臺 / 材料 / 試劑 / 設備 / 儀器等基礎設施對基礎研究的作用

我們可能都有一個體會,「第一次」特別困難,比如第一架飛機、第一顆原子彈、第一顆人造衛星、第一款 CPU、第一次火星登陸等等。哪怕曾經有其他國家實現過,另一個國家要實現「第一次」依然很艱難。

爲什麼?這主要因爲「第一次」研發的輸出不僅僅的是一款原型系統,而且還需要構建出一套研製該原型系統的技術流程以及相應的平臺 / 材料 / 試劑 / 設備 / 儀器等,也就是基礎設施。這些基礎設施的作用正是「把問題的底層原理搞清楚」,比如爲研製飛機建設的風洞,研製 CPU 需要有高精度的仿真器和模擬器。即使在物理、化學、天文等領域的基礎研究,現在也都離不開各種尖端設備和儀器,像研究核聚變的 EAST 託卡馬克裝置、研究天文的 FAST 望遠鏡等等。

在我從事的處理器芯片設計領域,很多人都看作是純粹的工程技術,認爲這裡面沒有基礎研究。但在我看來,能把一些問題的底層原理搞清楚,就是基礎研究。舉個例子,蘋果最近推出的 M1 採用了約 600 項 ROB,這完全顛覆了傳統 CPU 架構設計人員的觀念,因爲以往 CPU 的 ROB 一般都不超過 200 項。

也許用反向工程思維,可以很快做出一個也具有 600 項的 CPU 架構設計來。但是,你知道蘋果爲什麼敢這麼設計?爲什麼是 600 項 ROB,而不是 800 項?反向工程只是工程技術,但是如果能把這些問題的底層原理徹底搞清楚,那就是 CPU 架構設計領域的基礎研究。

真要搞清楚底層原理並不容易,這需要一整套 CPU 架構設計基礎設施的支撐——從程序特徵分析技術、設計空間探索技術、高精度模擬器、系統仿真技術、驗證技術等等;還需要對大量程序特徵進行分析,需要收集大量的原始數據,需要大量細緻的量化分析,需要大量的模擬仿真…… 這些都是爲了把底層原理搞清楚。

某種程度上,相比較於原型系統,平臺 / 材料 / 試劑 / 設備 / 儀器等基礎設施是更重要的輸出。只有具備這些,才能不斷地去深入探索各種現象的底層原理,才能支持後續的迭代優化,同時也能成爲培養人才的基地。

基礎研究也需要管理與組織

雖然很多基礎研究是純自由探索,但很多基礎研究也需要管理與組織,例如探測「希格斯」粒子、研製 LIGO 觀測引力波等。

DARPA 資助了很多顛覆性創新的項目。我們觀察 DARPA 的項目立項與執行過程,可以看到有一些共性特徵:

項目主管(Program Director)負責上述 4 個任務,具有絕對的項目決策權,同時也對項目負責,相當於抓總。

這種模式其實對基礎研究也有效。例如,清華大學施路平教授領導的類腦計算研究中心。2014 年成立,成員來自清華不同的院系。他們的研究模式就是類似 DARPA 項目,整個團隊圍繞「天機」類腦芯片開展全棧研究。從目前的成果來看,類腦計算交叉中心的成果還是很有顯示度,也發表多篇 Nature、Science 論文好,入選中國十大科技進展等等。同時他們也把類腦計算這個學科建立起來。