張鈸院士:發展第三代AI技術,中美處在同一起跑線上
(原標題:中科院院士張鈸:發展第三代AI技術,中美處在同一起跑線上)
深度學習是人工智能領域裡的一個研究方向,主要是學習樣本數據的內在規律和表示層次,這些學習過程中獲得的信息,對諸如文字,圖像和聲音等數據的解釋有很大幫助。它的最終目標是讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等數據。
但深度學習領域一直都存在算法黑箱問題,即算法的設計者並不清楚模型是如何得出結論和預測的,設計者無法對這個結果進行解釋和負責。
深度學習的另一個問題是容易被數據“噪音”干擾。只要在對抗網絡里加入一些“噪音”,可能就會讓計算模型出錯。典型的例子是,當自動駕駛算法的訓練數據存在被惡意添加了“噪音”(編注:噪音指的是人類無法察覺卻能夠對算法進行干擾的數據)後,可能會將STOP標誌識別錯誤,從而導致車禍。
算法黑箱、模型不安全易被幹擾,這些目前人工智能領域裡存在的問題,都向研究者提出了一個問題:未來,我們該向如何發展人工智能技術,從而使AI可以迎來二次曲線增長?
清華人工智能研究院院長、中國科學院院士張鈸以及他帶領的學生們給出的答案是:第三代人工智能技術。
近日,在北京舉行的“2020第三代人工智能產業論壇暨瑞萊智慧RealAI戰略發佈會”上,張鈸接受了澎湃新聞(www.thepaper.cn)的採訪,他認爲要解決現在人工智能在落地應用中遇到的問題,就需要打破現有的理論,邁向第三代人工智能。
在今年上海舉行的世界人工智能大會期間,張鈸對第三代人工智能做出過這樣的解釋:第一代知識驅動的AI利用知識、算法和算力3個要素構造AI;第二代數據驅動的AI利用數據、算法與算力3個要素構造 AI。由於第一、二代AI只是從一個側面模擬人類的智能行爲,因此存在各自的侷限性,不可能觸及人類真正的智能。
基於此,張鈸提出了出第三代人工智能的發展路徑是融合第一代的知識驅動和第二代的數據驅動的人工智能, 利用知識、數據、算法和算力4個要素, 建立新的可解釋和魯棒(音譯自“robust”,學術上即一個系統或組織有抵禦或克服不利條件的能力)的AI理論與方法,發展安全、可信、可靠和可擴展的AI技術。
發展第三代AI技術中美處在同一起跑線
在張鈸看來,基於第三代人工智能理論發展的AI技術,會讓中國和美國處在同一起跑線上,甚至隨着發展會處在領先位置。
早在2015年,張鈸院士就曾提出發展“第三代人工智能”的理念。2018年,清華大學設立人工智能研究院,張鈸擔任新研究院的院長,聘請圖靈獎得主姚期智院士作爲學術委員會主任。2019年,清華大學宣佈成立人工智能研究院基礎理論研究中心,聘任清華大學計算機系長聘教授朱軍爲研究中心主任。
新設立的基礎理論研究中心的任務是着眼於當前人工智能理論和方法的不足,以克服當前人工智能的技術侷限爲宗旨,以期建立魯棒(robust,指系統健壯、強壯;魯棒性是系統在異常情況下生存的關鍵)、可理解、數據高效和安全的第三代人工智能基礎理論和方法體系。
除了在基礎理論研究上,推進第三代人工智能發展外,在2018年,由張鈸、朱軍(擔任首席科學家的瑞萊智慧(RealAI)作爲產學研技術公司從清華大學人工智能研究院孵化成立。根據瑞萊智慧的官方介紹,公司就是以第三代人工智能技術爲依託,克服一般深度學習存在的諸多缺點,從根本上增強人工智能的可靠性、可信性以及安全性。
相比之下,美國第三代人工智能技術的發展主要依賴於DARPA部門(美國國防高級研究計劃局)。2018年,由DARPA宣佈啓動AI Next項目。
項目發佈時,DARPA在其網站上介紹,從上世紀90年代開始,DARPA幫助引領了AI機器學習技術的第二次浪潮,該技術從大量數據中創建了統計模式識別器。DARPA對自然語言理解、問題解決、導航和感知技術的資助,發明了自動駕駛汽車、個人助理和近乎自然的假肢,還有大量重要的、有價值的軍事和商業應用。然而,第二代人工智能技術依賴於大量高質量的訓練數據,不能適應不斷變化的條件,提供有限的性能保證,無法向用戶解釋其結果。未來第三代AI技術可能會極大地改變軍事任務規劃,科學家可利用機器開展研究,人類可與機器互動。
DARPA還給出了AI Next項目的重點,即發展新能力、高可靠性AI、對抗性AI、高性能AI、下一代AI以及人工智能探索計劃。
這幾點與張鈸提出的發展安全、可信、可靠和可擴展AI技術不謀而合。
“所以我們爲什麼強調第三代人工智能有一個非常重要的因素就是,這個是我們國家歷史上第一次遇到跟別人站在同一起跑線上,發展第三代人工智能,國外跟我們一樣。”張鈸告訴澎湃新聞。
胡潤髮布的2019年全球人工智能行業獨角獸企業排行榜中,前40名企業中,中國佔了15家,美國佔了20家企業。
在採訪中,張鈸認爲這份榜單也說明了現在人工智能技術在落地過程中遇到的問題。從數量上看,中美兩國之間的AI獨角獸企業差距不大。但是如果仔細研究榜單上的公司,會發現,中國AI企業的同質化明顯。
“這是不好的。你用同樣的技術,去做同樣的應用場景,那就說明這個技術大家都會有,大家都會的技術用到大家都能想到的市場,肯定競爭非常激烈。”張鈸說。
另外,由於第二代人工智能技術限制,目前國內的AI技術應用場景有限,同時還可能會有安全問題。
不安全體現在兩個方面,一是數據,二是算法。“一個隱私保護,一個知識產權,用戶的人臉數據憑什麼給一家公司用,怎麼用,數據都被公司收走,是否會造成不公平競爭,這些都是需要思考和治理的。”張鈸說。
再者,由於測試環境的脆弱性,很多算法在真實環境中,都極易被攻擊。在自動駕駛領域裡,系統就很容易被攻擊和欺騙。
這樣的現狀,也就爲第三代人工智能技術提供了發展前景。張鈸認爲,未來,一個算法可以被解釋,人們能瞭解機器做出預測的原因,且設計者有手段能阻止他人的攻擊。只有那樣,人工智能技術纔會迎來更好的產業發展。
目前,由清華孵化的瑞萊智慧就在朝這樣的方向探索。經過兩年的發展,瑞萊智慧近期對外交出了成績單,發佈了兩款最新AI產品:隱私保護機器學習平臺RealSecure和人工智能安全平臺RealSafe2.0版本,前者是基於安全多方計算、聯邦學習、匿蹤查詢等技術打造的數據安全共享基礎設施,通過打通數據孤島,解決企業機構數據合作過程中的數據安全風險和隱私泄露問題,後者是一套針對AI系統的防火牆與殺毒軟件,支持檢測對抗樣本攻擊、模型後門攻擊等新型安全漏洞,提供模型安全測評及防禦的端到端解決方案,大幅提升AI系統的安全性。
最後,張鈸在採訪中也提到了人才的培養,他認爲人工智能產業要進一步發展,必須是發展具有創新能力的AI人才。 “國內人才的平均水平,比如清華,不管是本科、研究生平均水平都很高,但最高水平跟人家差的太遠了。我們的人才培養中,沒出過愛因斯坦,也沒出過圖靈。這是我們未來需要思考的。”張鈸說。