吳及:用人工智能開啓未來學習的升級之路

12月22日,第十三屆本站教育金翼獎在北京隆重舉行。在主題演講環節,清華大學電子工程系副系主任,長聘教授,博士生導師吳及帶來了主題爲《人工智能開啓未來學習的升級之路》的精彩分享。

吳及提到:

下爲吳及主題分享內容,經本站教育編輯整理:

大家好,我來自清華大學電子工程系,是一名大學老師,也是教育的從業者,所以今天特別榮幸能夠來到本站教育金翼獎的頒獎典禮。

這是一個命題作文,讓我講一下人工智能和教育相關的話題,我是做技術的我更多的想從技術的角度講一講我自己的觀點——人工智能未來怎麼樣才能助力教育提高質量和提高效率。

我今天的彙報分兩個部分,第一部分講一講人工智能

因爲人工智能對大家來說是耳熟能詳的名詞,耳熟能詳就會存在一個問題,我們在交流的時候,每個人在說人工智能,我們心裡想的人工智能不一定是同一個東西,原因有兩方面:第一,技術本身發展非常快,人工智能這個詞的內涵和外延不斷在發生變化,十年前我們說人工智能,今天說人工智能,十年以後說人工智能,可能包含的含義完全不一樣;第二,人工智能這個詞,當初科學家起這個名字的時候,這個名字起的特別好,給了每個人充分的想像空間,即使沒有人告訴人人工智能什麼意思,你拿到這個詞以後也可以發揮想象力,無窮無盡的想象空間,正因爲以上這兩個原因,人工智能在認識上存在非常大的差異。

首先給大家看這張照片,人工智能這個詞最早起源是1956年在美國達特茅斯的會議上,造就了人工智能這個詞,這張照片是拍攝於50年以後,是非常有歷史意義的一張照片,這裡有三個人名,參加這個會的三位科學家之一,在信息技術歷史上做出巨大貢獻的三位科學家。第一位是麥卡錫,stanford人工智能創始人個,第二位是明斯基,MIT人工智能實驗室創始人,第三,香農,信息論創始人。

人工智能的發展也不是一帆風順的,我們今天叫人工智能第三次浪潮,1956年達特茅斯會議只求進入了人工智能第一個黃金期,在這個黃金期里人工智能的科學家誕生了很多想象,告訴人們人工智能可以做很多事,所以出現了用計算機證明數學定理,最有名的例子是“斯特定理”在地圖上用四種顏色可以把相同的國家分割開,數學家用一百多年沒證明出來,但是用計算機證明出來了。出現了歷史上第一個跟人聊天的機器人,出現了積木世界,這個持續了不到20年時間,隨着英國國會委託做了一個報告,這個報告給人工智能很大的打擊,他說當初人工智能給大家承諾的事情,20年後一件沒有做到,於是AI進入第一個冬天,所有的政府停止投入資金。

上個世紀80年代初進入第二個人工智能黃金期,有一些比較典型的成果,比如神經網絡,反向傳播算法,出現了專家系統,包括醫院的CBS系統,我們教給計算機一些規則,讓它幫助人們做一些決策,這樣的系統,曾經大家覺得,建十條規則可以解決一些問題,給它兩萬條規則,它可以解決更多的問題。日本開始了第五代計算機研究工作,這個持續時間也不到十年,又遇到很多問題,包括日本宣佈第五代計算機研製失敗,美國國防部高技術情報署停止了投資,規模大了以後再想應用變得極其困難,AI迎來第二次冬天。

到90年代以後,那個時候的AI不像今天,如果說哪個專業的學生學AI畢業,可能連工作都找不到,哪個人寫論文說我搞神經網絡的投到編輯部可能被拒了。但是歷史還在往前走,IBM開始做深藍,到2006年Hinton,深度神經網絡,到2011年,微軟宣佈他們通過深度神經網絡技術把語音識別錯誤率下降30%,這對於作爲這方面研究的人來說是非常大的突破,2012年,機器系統基於神經網絡系統戰勝了以往最好的系統,之後深度學習就變得一發而不可收拾,所有任務開始嘗試用深度神經網絡解決,而且它一直沒有讓大家失望過,所以這才迎來AI第三次浪潮。

還有一些標誌性的事件,有這個歷史我們會知道,並不是今天進入第三次浪潮就預示着未來AI會一路向上,也許過若干年AI會迎來第三次冬天,這個我們只能拭目以待,因爲這是未來。

在AI被社會廣泛認知最重要的事情,AlphaGo,AlphaGo橫空出世,從2010年開始戰勝歐洲職業棋手冠軍,2016年3月份戰勝李世石3:1,Master在職業頂尖取得60連勝,2017年3:0戰勝了柯潔,至此,大家相信,下圍棋這件事大家不要跟科技比了,這是全世界的一個證明,人工智能很厲害,人工智能被認知了。

其實開發AlphaGo的公司是很一個很聰明的公司,他找了一件非常適合機器乾的事情,圍棋儘管很難,但是它是遊戲,是封閉的,我們把它叫做全信息零和博弈,就是下棋雙方能看到棋盤上所有的信息,打撲克就不是,看不到對方的牌,圍棋是全信息的,信息輸入對系統至關重要,全信息對做好一個系統提供很大的便利。

第二,零和博弈,黑棋多佔一個,白棋少一個,361個空,我們看搜索空間極其巨大,任何一個計算機靠蠻力算不出來,圍棋裡下一個子,一個子下下去究竟好不好,在數據上都非常難以評估。還有一個現象,地平線效應,因爲地球是球形的,遠處有一艘船過來,你很長時間看不到,但是你一旦看到它,這個船立刻顯現在你面前。

這步棋好不好,可能三五十步都看不出來,可能20步以後下一步好棋,在AlphaGo之前,人類已經發明瞭很多的散發,使得圍棋的水平在提高,但是有限,那時候在AlphaGo之前,機器下圍棋的水平,可能一個人類的兒童,學了半年以後,下贏機器就毫無問題,但是AlphaGo引入了深度學習的技術,策略網絡+價值網絡,策略網絡,在現在的局面下,下一步棋下在什麼地方,價值網絡,現在的棋局判斷黑棋和白棋的勝利多少,第一,決策,在哪個地方下子,第二,判斷當前勝率多少,雖然觀察AlphaGo和柯潔或者跟李世石下棋時候,AlphaGo一直在計算着勝率,據AlphaGo的開發者來說,等它和李世石下棋的時候還有波動,和柯潔下的時候,AlphaGo一直它會贏,這個系統凸顯了這個技術所能帶來的變化。但是這是一個封閉系統,是全信息零和博弈,面對現實世界很多問題既不封閉,很多選擇是開放性的,人工智能要解決真實世界的問題仍然面臨巨大的困難。

這裡給出一個圖,有監督學習,我們給了數據和準確的標註,如果只給了數據沒有標註是無監督學習,下AlphaGo的棋是強化學習,根據這個棋盤未來的結果判斷當時下的棋是不是一步好棋,強化學習被推崇認爲是構建學習系統有效的途徑。

從人工智能發展來看,人工智能並不是唯一的技術流派,至少人工智能有三個技術流派,第一,符號主義:相當於人類閱讀知識,我們能讀文字,建立知識圖譜,建立各種知識工程,進行符號級的推理,這也是人工智能發展的重要流派;第二,連接主義,從人的神經系統那兒獲得啓發,信息存在在網絡當中而不存在在單個節點當中,基於這樣的啓發,發展出一整套人工智能網絡,包括深度學習技術,今天我們在第三次人工智能的浪潮最核心的進展還是在深度學習的部分;第三,行爲主義,前面符號主義和連接主義只是模擬人的大腦,並沒有模擬真實生物,行爲主義,不追求那麼高的目標,先有一個機器的生物在自然界當中完成一些基本功能,比如行走、上臺階、開門、這一派觀點認爲是爲主義,今天有一個更形象化的名字“具身智能”,像一個生物一樣生存在自然界,大家如果關注到可能會知道一個非常有名的公司,波士頓大狗,人工智能其實有很多個流派,這些流派在人工智能的發展過程中互相依存,協同發展,有些走的快一些,下一個階段會趕上。

第三次人工智能的浪潮爲什麼獲得今天的成功?還是不同於前兩次,第一,我們今天叫快速增長的計算設施,人類用的計算能力,如果不計代價,可以認爲有無限的計算能力,自己的筆記本算不過來,可以連到雲和服務器上;第二,我們越來越有能力採集更多的數據,我們無論做哪一個方向都需要通過數據分析,現在人類採集數據能力非常強。還有非常重要的算法,深度學習,深度神經網絡爲基礎的算法,有了他們一起作用,才使得人工智能走到今天的局面,我們應該客觀的說,今天的人工智能水平比前兩次人工智能的水平要高很多,我們能做很多事,同樣也有很多事情做不好,做不對,或者有人開玩笑說,沒有標註,沒有人工就沒有智能,我需要對數據進行標註。也有人說系統表現的不那麼聰明,甚至有點智障,我們爲人工智能技術應該客觀的看待,它比以往強大,能做很多事情,但是還有很多不足,還有很多它做不了的事情。

Gartner技術成熟度曲線,任何一個事情按照這個曲線發展來看,都有初發、期望膨脹,然後進入幻滅低谷,但是會緩慢的復甦,這樣一個波峰波谷走了不止一次,是不是三次能走完,我們不知道,很當先進技術都有這個過程。

現在出現了各種各樣構型的神經網絡,這是我想講的第一部分,關於人工智能我自己的見解和認識。

第二,人工智能和教育行業。

以我們現在國家發展的階段,社會的經濟水平,我們對教育對人才培養的需求越來越大,包括政府對教育提出很高的要求,我們有“雙減”,我理解最終目的,我們需要培養的人是有全面素質的,有更好的創造力,而不是隻是會學習考試內卷的,那麼在這樣一個背景下,教育最需要做的事情就是提質增效,讓學生更有效的學習,以更高的效率掌握知識和技能,這樣的人才可能是我們未來社會發展更需要的。

這樣一個途徑是什麼?從做技術的角度,三個過程,數字化、科學化、個性化。

給大家舉個例子,教育當中個性化推薦可能是現在做的相對成熟或者比較有效果的學習方式,一個孩子學那麼多知識,或者做那麼多題,總會有一些方面學的好,有些學的不好,我們現在教育講的是同質化,所有同學做同樣的作業,所有同學參加同樣的考試,面對同樣的問題,如果我們瞭解每個學生強在哪兒,不足在哪兒,如果要發揮它的長板應該學什麼,補足短板應該學什麼,我們就能夠給他們提供個性化的能力,個性化對提高效率,提高質量來說非常重要。個性化這件事並不那麼容易,個性化,我們得知道學生的現狀,瞭解知識的體系和架構,需要我們的教育工作者投入非常多的精力把知識的結構描述出來,在這個結構下定位每個學生哪兒是不足之處,這個不足之處由於什麼造成的,知道根源在哪兒,會更有效。

如果有很多基礎性的工作,我們會讓不同的學生走不同的學習路徑,從而有更好教學效果,未來個性化教學的道路是重要的發展方向,某種程度來說,教育培養人也不希望培養出來是千篇一律的人,系裡做教學改革的時候,我們在大學裡不光有核心課,還有各種選修課,我們每年培養出來三百個學生,每個學生的特點都不一樣,因爲社會需要不同的人才,而不是千篇一律的。這需要大量的工作需要大家一起努力。

第二,技術對細節的追求。

(清華附中校長)王校長非常重視體育鍛煉,特別是在清華附中,鼓勵孩子們從事各種各樣體育運動,從體育運動來培養孩子的素質和精神,這一點我非常贊成。

奧運會提高成績靠什麼?肯定得個性化,個性化以後做什麼?我們去分析,比如蘇炳添的特點是什麼,他個子矮,步長不如黑人,但是他的步頻快,蘇炳添在29歲以後跑進了10s,這是非常不容易的,如果沒有詳細的技術分析,很難讓運動員做這麼精細化的調整。

跳水,中國跳水已經可以對3D成像虛擬化做的那麼細,如果拿這個教育運動員,或者把這個技術用在學生身上,也會取得更好的效果。

我們自己也在做一個工作,對學生在中學裡的體育來說,引體向上是比較難的題目,拉不起來,拉不起來很多時候不一定完全是這個學生能力不夠,很重要是發力方式不對,他們告訴我引體向上拉的好應該是背部肌肉發力,而我們學生是腹部肌肉發力,所以我們做了一個分析,讓實驗室做引體向上的時候,我們拍視頻拍他怎麼拉,而且放了機電感應器,用力情況好的人能做起來,腹部在發力,臂部發力不夠的同學就是拉不起來,我們採集的數據驗證了這個觀點,我們告訴學生如果背部肌肉不夠,或者背部發力方式不好,能不能做一些特定的鍛鍊,讓他增長背部肌肉,學會背部發力。如果有這樣的方式,相當於我們能夠針對性地解決每個學生的問題,提高他的能力,我跟清華體育部的老師交流比較多,他們說不一定拼命上量是好事,還是要科學,跑量,每天跑這麼多就夠了,再跑沒用,只有損失,缺失哪兒就練什麼,這纔是科學化個性化,在數字化基礎上的工作。

我們未來在任何一個方向的教育或者學習都要形成這樣一個閉環,首先是智能化信息採集,做知識能力綜合評估,形成個性化的學習或者訓練方案,再進行質效評價,有了這個過程以後知道學生的優點在哪兒,缺點在哪兒,針對他的缺點怎麼改進,改進方案有沒有效,有效可以堅持,沒有效可以換一個方案,如果這樣可能會給我們的孩子帶來更多的幫助。當然技術不是全部,我們需要有管理、專家,但是在這個過程中技術也許能發揮一點作用,在數字化、科學化和個性化的過程當中,給我們的教育提供一些幫助,使得質量和效率能夠得到進一步的提升,爲我們未來的社會培養更出色的人才,謝謝!

附嘉賓介紹:

吳及:

清華大學電子工程系副主任,長聘教授,博士生導師。清華-訊飛聯合實驗室主任。IEEE 高級會員,中國語音產業聯盟技術工作組組長,認知智能國家重點實驗室學術委員會委員,口腔數字化醫療技術和材料國家工程實驗室第二屆技術委員會委員,中國計算機學會語音對話與聽覺專業組委員。2018-2022教育部電信類專業教學指導委員會副秘書長,承擔國家重點研發計劃、863、國家自然科學基金、工信部電子發展基金等多項國家科研項目。

吳及1996年畢業於清華大學電子工程系無線電技術與信息系統專業,2001年獲得清華大學電子工程系信號與信息處理專業博士學位。2006年,清華大學與AI龍頭企業科大訊飛聯合創立清華-訊飛醫療語言處理技術聯合研究中心(清華-訊飛聯合實驗室),吳及擔任實驗室主任。清華-訊飛聯合實驗室是集產學研於一體的創新團體,聚焦於智慧醫療行業,所研發的醫考機器人“智醫助理” 以超過96.3%的人類考生的高分456(總分600,及格線360)成功通過了國家執業醫師資格考試,是世界上首個通過國家執業醫師資格考試的AI醫考引擎;相關成果在AAAI,ACL,BIBM以及自然子刊Nature Communication等頂級期刊會議發表高水平學術論文數十篇,申請專利數十項。