京東探索研究院陶大程:超級模型生態系統將引領新一輪產業變革
陶大程,京東探索研究院院長、澳大利亞科學院院士。陶大程在2021年榮獲IEEE Computer Society Edward J McCluskey技術成就獎,2018年榮獲IEEE ICDM研究貢獻獎(數據科學領域技術成就最高獎之一),2015和2020年兩度榮獲澳大利亞尤里卡獎,2015年榮獲悉尼科技大學校長獎章以及悉尼大學校長傑出研究貢獻獎。2020年,他被《澳大利亞人報》列入“終身成就排行榜”,成爲研究超級明星之一。他是ACM/AAAS/IEEE Fellow,歐洲科學院外籍院士、新南威爾士皇家學會院士、澳大利亞科學院院士。自2014年起,連續7年入選科睿唯安“全球高被引科學家”。2021年,陶大程在 Guide2Research.com 評選的“計算機科學與電子學”類H指數最佳科學家排行榜上,榮膺澳大利亞第三名(人工智能領域排名第一),世界排名第53,全球華人排名第8。
人工智能技術在如圖像識別、內容推送、自動翻譯等許多垂直領域已有廣泛應用,同時,人工智能技術在應用的同時面臨許多可信挑戰,例如,特殊構造的圖案會誤導商品識別系統產生識別錯誤,缺乏可解釋性的自動駕駛系統可能引發人工智能技術的信任危機。
澳大利亞科學院院士、京東探索研究院院長陶大程表示,在無時無刻不在使用人工智能的當下,AI向善還是向惡,實質上由使用者決定,因此挖掘羣體信息、提取有效數據的同時保護個人隱私尤爲關鍵,驅動AI向善、發展可信人工智能逐步成爲全球共識。
針對有效應對可信挑戰,國內衆多科技公司已展開許多研究和探索。京東探索研究院將可信人工智能作爲三到五年的研究方向、將超級深度學習作爲五到十年的研究方向、將量子機器學習作爲十到十五年的研究方向,三者互爲承接、循序漸進。
陶大程認爲,由於可信涉足面廣泛,關注點不一,研究首先需要明確可信人工智能度量的標準,並構建可信人工智能的統一框架。目前,可信人工智能相關研究大致可以歸結爲穩定性、可解釋性、隱私保護及公平性四個維度。“把不同方面的關係理順後,人們才能夠真正認識到可信人工智能,未來才能夠真正形成相關具體的條例去實施。”陶大程指出。
可信人工智能研究通過理解深度學習工作機制、分析風險、研究深度學習的新算法,分析神經網絡的幾何代數性質和泛化能力,以保障人工智能應用的可解釋性。
深度學習則是要從基礎理論出發,研究面向海量多種模態數據超級神經網絡模型的深度學習新範式。目前,人工智能技術在落地的過程中存在應用場景複雜、模型單一、算力分佈較爲分散、基礎理論層面缺乏可解釋性等難點,導致中小企業在數據和算力都有限的情況下,更易面臨人工智能的應用困境。
隨着深度學習的進展,研究者發現在同樣的數據下,模型越深效果越好。“超級深度學習的泛化性能、獲得更有效的初始化等方面優勢明顯。”陶大程表示。
更進一步,超級深度學習能夠有效地整合不同模態、不同來源、不同任務的數據和信息,進而滿足新的生產需求、新的應用場景、新的商業模式,實現數字經濟變革,因而被認爲將會引領產業的下一輪變革。
在這種背景下,超級模型生態系統應運而生。通過構建超級模型生態系統可以推動人工智能技術更高效地落地,應用涵蓋科技創新、經濟發展、文化融合等多個維度,以此引領新一輪產業變革。
在陶大程看來,超級深度學習模型是超級模型生態系統的核心,針對各個領域中存在的普遍問題,包括數據不足、數據孤島問題以及模型性能有限等問題提供了有效的解決方案,包括利用超大規模無標註數據進行自監督預訓練、知識蒸餾、遷移學習等,同時通過構建完備的數學理論等模式,增強了模型的可解釋性,使人工智能算法做出的決策更易於評估。
比如,在數智健康領域,超級深度學習可以表徵海量分子結構,能夠加速新藥物研發;還可以對全棧醫學影像表徵,實現自動診斷、治療方案推薦、預後分析、復健助理、全週期呵護,更能對大量多模態公共服務數據聚合分析,全方位多角度實現公共健康監控,助力人工智能在公共衛生、疫情研判、情緒管理、地圖服務、基因檢測、藥物研發、互聯網醫院等多種具體場景中發揮重要的作用。
陶大程表示,目前各個國家都在佈局超級深度學習,“預計超級深度學習在未來5到10年將會對數智化社會供應鏈體系起到關鍵性的支撐作用,從而賦能全產業鏈,其中包括智能零售、智能物流、智能供應鏈等多個與人類需求密切相關的產業。”