湯曉鷗:一位被人工智能事業耽誤的“脫口秀大師”

編者按:2018年12月28日,由本站智能、清華大學數據科學研究院和25家評審機構共同評出的「2018中國AI英雄風雲榜」年度人物榜單揭曉,10位人工智能領域從業者獲獎。其中,商湯科技創始人香港中文大學信息工程教授湯曉鷗榮獲技術創新人物大師獎。

文|丁廣勝

“他是被人工智能耽誤的脫口秀大師。”

聽過很多場湯曉鷗的演講,嘉賓和好友都發出過類似的感嘆,不同於枯燥難懂的學術會議,湯曉鷗總能寓教於樂,講懂技術還能帶給觀衆歡樂。

“實際上我們做學術的是有骨氣的,就是說不能爲五斗米折腰,但你如果有六斗的話。”

“阿里講讓天下沒有難做的生意,做人工智能的得講讓天下沒有難吹的牛。”

“這次演講,我準備了100頁PPT,大概會講8個小時(午飯時間)。”

他還曾迴應稱我不是段子手,段子手是爲搞笑而搞笑的,“我只是幽默,是看到事物的本質”。

正是對科學本質的不懈追求,讓湯曉鷗成爲最有趣的科學家

萌芽:從圖畫書到學術大牛

作爲科學家,湯曉鷗目前擔任香港中文大學信息工程系教授,同時還擔任中國科學院深圳先進技術研究院副院長。作爲創業者,湯曉鷗是商湯科技創始人。

湯曉鷗很小就對圖像產生了濃厚的興趣,看了大量的圖畫書,他曾對南方都市報表示,這也許是他以後從事計算機視覺研究的萌芽。

1990年,他獲得了中國科學技術大學學士學位,第二年,湯曉鷗前往美國深造並獲得羅切斯特大學碩士學位,1996年攻讀了麻省理工學院(MIT)博士,在MIT期間他曾加入海底機器人實驗室。博士畢業之後,他回國在香港中文大學信息工程系任教,還在微軟亞洲研究院工作了三年,從事計算機視覺相關的研究。

2009年,他和其博士研究生何愷明(也是本次AI英雄風雲榜技術創新人物新銳獎獲得者),聯同微軟亞洲研究院的孫劍博士,憑論文“基於暗原色的單一圖像去霧技術”奪得IEEE電腦視覺與模式識別大會(CVPR)該年度的“最佳論文獎”,轟動一時。

圖:湯曉鷗(左)與何愷明

創業:從港中文多媒體實驗室到商湯科技

在微軟工作期間,湯曉鷗還遇到了楊帆,楊帆是2006年加入的微軟亞洲研究院創新工程組,負責視覺算法產品轉化,參與了Xbox、Kinect、Windows Hello、Bing圖像搜索等視覺技術產品模塊的研發,在微軟工作近10年之後,楊帆選擇加入湯曉鷗創業團隊,作爲聯合創始人、副總裁職務負責商湯智慧城市業務。後來,楊帆還帶去了一大波自己的清華學生,商湯的人才隊伍開始枝繁葉茂。

圖:商湯科技副總裁楊帆(左)和商湯科技CEO徐立

其實,早在2001年,湯曉鷗就一手建立了香港中文大學多媒體實驗室,深入探索計算機視覺領域的研究工作,這間實驗室的初創團隊就是成立商湯科技的前身。

在成立實驗室之後的十年間,湯曉鷗還是IEEE院士,同時擔任ICCV(IEEE國際計算機視覺會議)2009 程序委員會的主席。

時間來到2014年,這間實驗室迎來重大突破。當年3月份,湯曉鷗團隊發佈研究成果,基於原創的GaussianFace人臉識別算法,在LFW數據庫上準確率達98.52%,首次超越人眼識別能力(97.53%),超過Facebook同時間發佈的DeepFace算法(97.35%)。被評爲人工智能領域影響因子最高的國際會議AAAI2015的最佳學生論文。

之後他們入選了世界十大人工智能先鋒實驗室,成爲亞洲區唯一入選的團隊。福布斯更是稱他爲“中國人臉識別技術背後的面孔。”

這一年,湯曉鷗作爲創始人宣佈成立商湯科技,香港中文大學多媒體實驗室團隊成員徐立擔任聯合創始人、首席執行官。另一位聯合創始人徐冰也來自實驗室團隊,他上大二時,修讀了湯曉鷗的計算機視覺課程,併產生了濃厚興趣,在大四末期決定加入香港中文大學多媒體實驗室攻讀博士。後來,他跟隨湯曉鷗加入商湯創始團隊,擔任聯合創始人職位。

橫跨學界工業級,讓湯曉鷗的眼界更加開闊,對行業也有着更爲精準的判斷。湯曉鷗創業的早期投資人、IDG資本合夥人牛奎光曾表示,當時飛赴香港看商湯早期團隊,只看了五六個計算機識別技術的Demo就決定投資,“這是IDG唯一一個沒有看產品就投資的項目。”

可以說,創建商湯科技是學界人工智能科學家面向工業的一次集體實踐。作爲領航者的湯曉鷗在工業界積累多年,如今,商湯成長爲人工智能領域最熱門和融資額最高的公司之一。

“曬娃狂魔

“曬娃狂魔”科學家的稱號,源自於他一次實驗性的研究。

早在微軟亞洲研究院工作期間,湯曉鷗的兒子出生了,爲了表達愛意並彌補工作忙不能時常陪伴孩子左右的不安,他開始頻繁地給兒子拍攝照片,相冊幾乎涵蓋了孩子成長的每個瞬間。

直到照片積攢到成千上萬張時,他意識到分類成了難題,想在海量照片裡找到某個時間段或某個有趣瞬間的照片非常困難,在計算機視覺技術還遠沒有今天成熟的時候,他決定一試,叫來幾位學生開始研究名爲Photo Tagging的課題,採用計算機視覺的技術手段來給相冊進行分類整理

通過計算機視覺技術給人臉進行分類等計算應用,也成爲湯曉鷗之後很多演講場合的經典案例,技術的起源——湯曉鷗的兒子也開始頻頻亮相他的Presentation,他多次調侃到,我的演講都是從照片開始的,因爲第一,這是我兒子,第二,他長得漂亮。

“原創”一詞,同樣成爲湯曉鷗口中的高頻詞彙,在商湯AI峰會等多個場合,湯曉鷗提及電影工業和人工智能行業類似,十幾年前,很多人去買盜版VCD或者網上下載盜版電影,如果一直持續到今天,恐怕導遊和演員就沒有動力堅持下去了,今天中國電影市場的繁榮,正是因爲我們對於原創和版權的尊重。

人工智能正是如此,在一次演講中,湯曉鷗以谷歌舉例,稱這家公司的成功正是得益於對原創的尊重,2014年,有一家公司叫DeepMind,只有12個員工還沒有賺錢,只是在用深度學習玩遊戲和下棋,但谷歌果斷花了6.6億美金收購了這家公司。

在湯曉鷗看來,如果是在中國,大家就會花幾百萬美金把人一個個挖過來,因爲那要便宜得多,但是如果那樣做的話,就是對原創的不尊重,就不會有後來的AlphaGo了。

“AlphaGo開創了一個時代。”他說道。

炮火越遠的人越危言聳聽

作爲中國人工智能行業最資深的老兵,湯曉鷗對於AI的觀點句句犀利。

他認爲並不存在AI這個行業,只有AI+行業,AI需要與傳統產業合作,而且這種關係是結合與賦能,絕不是顛覆,AI的價值是幫助傳統產業提高生產效率,解放生產力。

在學術研究方面,他們團隊不滿足於98.5%的準確率,在2015年,團隊用30萬人臉進行訓練,達到了99.55%的準確率。2016年,他們用6000萬人臉訓練,達到了百萬分之一的誤識率。2017年,用20億人臉訓練,達到了一億分之一的誤識率。

在這時,商湯的AI+路線全面鋪開,落地應用在了智慧城市、金融、汽車、智慧零售、智能手機、移動互聯網、機器人等各行各業,他們提出了1+1+X戰略,1代表研發,第二個1代表技術產業化,X代表合作伙伴。

產業落地速度和融資速度並駕齊驅,湯曉鷗的創業團隊幾乎拔得AI行業頭籌。據報道,在2017年上半年,商湯收入實現了480%的增長,客戶數量增加到400家,公司估值達到45億美金。

“我們不燒錢,可以自負盈虧”湯曉鷗認爲燒錢就是“敗家”。創業成績的背後,他總結爲對於技術原創的堅持和對人才的超乎尋常的重視,擁有百餘位人工智能資深博士的研發團隊,可以稱得上的一筆寶貴的財富。

但前路漫漫,湯曉鷗最近對未來人工智能行業發展還提及了幾點建議,一是認爲我國人工智能產業佈局有同質化,重複建設傾向;另一方面,拔苗助長式地催化人工智能企業,缺乏人工智能技術與產業發展的深度融合。

第二,目前的國際環境對基礎研究的合作,特別是與發達國家學術機構的深度合作,造成一定困擾;此外,目前中國走出國門的產業多集中在國有企業的重大基礎設施,民營高科技企業還沒有形成規模化出口落地。

這都是未來一段時間,中國AI產業在技術之外,可持續發展面臨的難題與挑戰。

他還認爲離AI越遠的人越喜歡危言聳聽,讓AI行業理性,讓AI落地賺錢成爲2019年整個行業的新使命。

作爲離“炮火”最近的人,湯曉鷗正在路上,而且大步向前。