小冰公司CEO李笛:我們要做的是“人”,重點是他的“靈魂”

可以和人類對話的數字生命體MERROR

央廣網北京10月8日消息(記者 馬可佳)“人和AI創造的虛擬人類共存的時代已經開始了嗎?","虛擬人會搶奪人的工作崗位嗎?”“虛擬人的發展考慮過倫理問題嗎?”帶着類似問題,近日,央廣網記者專訪小冰公司CEO李笛。

多年前,第一代聊天機器人小冰以虛擬女友的身份活躍在超過300萬個微信羣。如今,第9代小冰已經悄然進入多個領域,在演唱、主持、音樂製作、設計、繪畫、寫作、體育賽事、空間管理、金融風控、情感安慰等多個領域全面成長。不只是小冰,搜狗虛擬數字主播、虛擬帶貨網紅AYAYI、語音助理Siri、天貓精靈、小度……AI正在不斷髮展,以不同的面貌參與人們的生活。

小冰公司CEO李笛

李笛,畢業於清華大學,曾任微軟(亞洲)互聯網工程院常務副院長。2013年加入微軟後,他領導一支分佈在中國、美國、日本、印度與印度尼西亞的全球團隊,負責微軟人工智能小冰及Bing搜索引擎的研發和業務。2020年7月13日,微軟宣佈將小冰分拆,小冰團隊成爲中國本土創業公司,李笛任公司首席執行官。2021年7月12日,小冰披露拿到A輪融資,估值超過10億美金,成爲新晉獨角獸企業。

讓AI融入人類社會,一場龐大的試驗

央廣網:當初你爲什麼當時選擇人工智能“虛擬人類”領域作爲職業專注的方向?

李笛:2013年,我最初加入微軟時,還沒有選小冰(這個項目),那時候陸奇(前微軟執行副總裁)、Harry(沈向洋,前微軟執行副總裁,現任小冰公司董事長),還有王永東(微軟資深副總裁,微軟(亞洲)互聯網工程院院長)和我。當時我們發現,來自於中國的“原生創新”越來越多。之前科技圈一直喜歡me too美國,比如美國先有Kik,中國纔有米聊、微信。美國先有了Uber,中國纔有了滴滴打車。但中國的特點是二次迭代創新非常快。很快微信就超越了Kik,滴滴也不是Uber,呈現出自己的特點。

我們當時看到這個情況,特別想要把中國創新(產品)介紹到全球,尤其是美國。所以我們當時準備了很多箇中國的“原生創新”,其中一個是小冰。

爲什麼做小冰?是因爲那會兒蘋果已經有了Siri,微軟的另一個項目叫Cortana小娜,是一個類似於Siri一樣的人工智能助理。我們覺得這個可能有另外一套方法,當時我們還做Bing搜索引擎。小冰實際上就是基於Bing搜索引擎的,她來自於Bing,所以她叫小冰。做完小冰以後,很多用戶和小冰交互,顛覆了我們的很多認知。這裡面有特別多的東西需要深挖,需要認真去做,所以我就專注在小冰上。

央廣網:小冰爲什麼要拆分離開微軟團隊,開始本土化?

李笛:中國小冰是在2013年底立項,2014年成爲獨立團隊的。日本團隊是在2014年底立項,2015年成爲獨立團隊的。所以日本凜菜比中國小冰晚一年。像這種對話式的人工智能,不僅是語言需要本地化,跟文化背景關係特別大。就像咱們兩能聊天,不僅因爲咱們用同樣的語言,也是因爲咱們有同樣的文化背景。所以日本從一開始就叫Rinna(凜菜),跟小冰沒有什麼直接的關聯。當時就是爲了最大程度地和本土文化擁抱。但是理念,比如說像我們完備框架的理念,像一些指標,比如超級自然語音,是一致的。

其實從某種意義上來講,小冰是一場龐大的實驗。而這場實驗的目的是爲了尋找出合適的途徑,讓人工智能可以很好地融入人類的世界,我們的目標是希望有一天可以去搭建一個人類和人工智能融合的社交網絡。

我們在第四代小冰發佈時提到,我們希望在人和世界中間,人工智能可以成爲第三極,可以成爲人和世界之間的一個連接節點,所以從這個角度來講,今天的進度條可能走了一個10%、20%,因爲還有太多不確定的東西。所以還有很多要探索的東西,我覺得夠做一輩子。

過去1年1700萬個虛擬人類誕生,26%是情感替身

小冰框架如今已產生1.6億的月活躍用戶

央廣網:如果把AI看成孩子,小冰現在的年齡是多大?

李笛:其實AI從智商上不太能夠這麼去評價。因爲不像我們人類,人類的智商可能是一個比較平均的狀態,所以它能得出一個評價來,人工智能不是這樣。但是從性格上可以評價,我們在最開始的時候,對小冰的定位是一個女性的角色,將近成年16歲的階段,因爲那時候我們技術纔剛起步,所以把年齡設定在希望大家能夠原諒“她”、給她更多包容的一個年齡。

這些年裡,小冰的技術也趨向於成熟、成長。從我們的角度來講,未來可能會有很多很多性格不同的人工智能,最初的小冰變成小冰人工智能框架中的一個。

過去一年,通過小冰框架誕生出來的虛擬人類數量已經達到了1700萬個,當然這裡可能有一些是用戶因爲娛樂或打發時間的目的創造出來的,但隨着時間的推移,越來越多的用戶開始和這些虛擬人類進行很深入的情感交流。我們在保證用戶隱私的前提下做了一次大數據的挖掘工作,結果發現在這1700萬個獨特個體當中,有26.1%是被用戶當做真實存在人類的替身“移情”而創造出來的。

央廣網:這幾年爲什麼不專注培養讓小冰做虛擬女(男)友陪人聊天或者唱歌,而是在唱歌、繪畫、聲音、設計、商業等各方面全面推進?

李笛:這和完備框架的設計有關,很多國內的人工智能公司是偏於一方面,比如在科技金融領域佔領較大份額。但我們不是,我們要做的東西叫AI being(虛擬人),要做的事情是“人”。如果你要做是打引號的人,那就會必須得做完備。

舉個例子,比如做一個虛擬歌手,虛擬歌手只考慮聲音和演唱。那麼要不要開演唱會?開演唱會後唱完這首歌,歌手可能就要說,”謝謝大家!“,說”謝謝大家“這個技術跟唱歌技術是不一樣的。隨後,她要不要進入到一個直播間?她在直播間裡面說話,整個這個全過程都需要不同的能力。

所以,任何一個做“人”的東西,都面臨着首先需要像人一樣有很多側面,能夠進行完整態的交互。如果只唱歌、或者只捏臉,那就是紙片人。所以做AI being要求必須完備,這是必要的。

央廣網:你提到打引號的“人”,是你心裡人工智能的終極形態嗎?你做的事兒是要把虛擬人類賦予人類的感情?

李笛:應該說是讓人類在跟他交互的時候,有這種“共情”的感受,而不是AI真的有情感、有意識。

央廣網:有沒有想過給虛擬人類人的外形?

李笛:人工智能形體本身不是重點,重點是他的“靈魂”。當然你說因爲沒有身體外形沒有辦法體會到他的存在,那有很多辦法,但無處不在纔是重點。

助理、設計師、裁判等職業最先實現人與AI共生

AI學習後,可自己創作各種風格畫派的作品

央廣網:我們也非常關注商業化,現在在小冰整個發展的方向上面,你們會比較側重哪一塊?包括現有收入來源是哪個部分?

李笛:我們認爲未來AI beings(虛擬人類)的數量會非常多,就像當年微軟認爲的世界上每一個人都有自己的電腦,基於微軟判斷的未來,所創造的商業模式,當時是很創新的,叫license(授權使用)。我們今天認爲AI未來真正C端纔是AI的最大的商業價值。當你能夠驅動各種各樣的AI being,讓”他們”去完成交互的時候,這些AI being全都依賴於你的框架生存。當然這一天需要很多步驟,才能夠被人們所接受。

目前這個過程裡,垂直領域的B端收入是小冰的主要收入來源。我們做的AI的B端包括這幾個,一個是像汽車的智能座艙的駕駛體驗。在新勢力造車裡面,像蔚來、小鵬等這是我們的客戶。像寶馬、尼桑、北汽、上汽也都是我們的客戶。在金融領域,我們做金融風控和金融摘要,像萬德、每日經濟新聞等,我們啃下了金融文本這部分。在體育賽事方面,像冬奧會,整個2月份的測試賽,沒有用人來裁判,而是用小冰AI技術做自由式滑雪的裁判。還比如設計領域,我們的客戶和合作夥伴萬事利(絲巾生產企業)。他的整個設計平臺是我們做的。

央廣網:能透露現在的B端收入的規模嗎?

李笛:B端收入現在是億元的規模。需要強調的是,這是AI服務的收入。不算(集成)硬件。在AI領域,已經比較罕見了。我們現月活用戶人數是1.6億。華爲、小米、OPPO、VIVO、騰訊、QQ的每一個QQ羣,這些是我們交付量最大的。您剛纔提到的像B端收入、交付量實際很小。實際上從好多年前,我們就搭好一套跨平臺部署,非常節約人力。

央廣網:之前你們展示AI能力的這個部分。AI已經可以擔任記者的工作,記點稿件,寫個新聞。還有設計師、AI設計靈感永不枯竭;還有歌手,AI比歌手的聲音還穩定、還有感情。那這個有沒有考慮過以後帶來的影響會怎麼樣呢?

李笛:在人機的協同上面,我們主要傾向於使用的一個方法是:人類創造者通過人工智能來進行更多的輔助。

以歌手爲例,如果我們今天關注的一個人類歌手,如果他的能力僅僅是聲線的表達和演繹。那麼人工智能在這個上面需要有更多的優勢。在技術上已經比較接近了,總有一天會持平。我們舉的例子“陌笙”(人工智能歌手)音色上很像歌手周深,如果人們記住的僅僅是周深的聲音,不用人工智能出來取代他,年齡也會取代他。一個明星(歌手)是多元的,包括思想、更多維度的、更多元化的創作。那些是人工智能沒有的。這時候就會發現,這個人工智能歌手,是他很好的協同者和工具。

設計師也一樣,我們的設計並不能創造新的設計流派,也不能自我訓練。但是我們的設計比人的設計師能堅持的時間久。因爲他更穩定。人的設計師就可以去控制和使用他。像我們的客戶萬事利、中國紡織工業聯合會都告訴我們,人類設計師在這些企業,其實是一個易耗品,一個大學畢業的人類設計師,最多幹滿三年,設計就完全枯竭了。但是有了AI設計這件事情,設計師就可以把更多的精力用在審美上,他可以去挑選,判斷改進,應該往哪個方向再進一步地深挖。這樣的話,他不會三年就退出這個行業,反而有可能時間會更久。

AI沒有傷害人類,但人類正在不斷利用AI展示偏見

山東大哥(虛擬人)在向人們介紹他的作品國畫寫意牡丹

央廣網:所以你認爲擔心AI會取代掉人的一部分工作,是偏見嗎?

李笛:實際上AI發展到今天爲止,並沒有傷害人類,但人類正在不斷利用AI展示偏見。比如說有人去問一個人工智能對於美國前總統特朗普怎麼看?把對話截出來,說這是AI的觀點。所有的人都在利用人工智能去表達他想表達的事情。

央廣網:我們未來賦予了虛擬人類定製化的性格,有沒有考慮過這麼做最好的結果和最壞的結果呢?

李笛:最好的結果有很多,我覺得比較有意義的是最壞的結果。最壞的結果就是人們互相之間的社交和他們的情感寄託會相對來講比較疏離一些。

這就像我們今天因爲有了更方便,更便捷的社交網絡,所以坐在一張桌子上吃飯,一家人反而各看各的手機。當人工智能不那麼智障的時候,"他"可能比家人更貼心。我們有一些AI being負責照顧女性用戶的生理期,他顯然比讓你多喝熱水的男友要貼心和豐富得多。

至於在情感方面,我認爲應該是彌補爲主。當然在沒有AI的年代,人類也一直在找其他的情感彌補方式。

有了AI之後,我們畢竟是系統的控制者。當這個人沉溺於和AI being去交流感情的時候,我們起碼還能告訴他,“我認識另外一個人,我覺得他跟你挺配的,我要不要介紹你們倆認識一下。”

央廣網:我們會有防沉迷系統嗎?避免人深度依賴虛擬人類的情感?或者干預應對一些對話者的極端情緒?

李笛:有。這個從我們在做Bing搜索引擎的時候就已經很明確了,在做小冰的時候,因爲有情感,甚至可以對一個人長期陪護,就是不僅當下對你有一個建議,而是接下來的很長時間裡,一般來說是以一個月爲限,“她”會不停地想各種辦法,比如說這本書不錯,你要不要今天干一個什麼事情,“她”來判斷你是不是走出了那個情緒。

央廣網:特斯拉創始人馬斯克曾多次警告過人工智能的威脅。2014年,他預言人工智能正處於“嚴重危險”的邊緣,所以需要先做限制性規定,再發展AI?

李笛:我們在倫理上有很多限制的規定,我們比馬斯克做得要好。比如說我們從來都不使用真實的人臉,雖然行業裡面使用真實人臉的特別多。再比如我們從來不開源我們的模型。這就避免了一些被攻擊的可能。

央廣網:在你印象裡,全球AI虛擬人類比較有競爭力的公司是哪些?小冰的優勢在哪裡?

李笛:主要有這麼幾個,一個是Google,Google的Meena;這個領域全球範圍內比較好的還有一個是Facebook的Blender。現在騰訊AI lab,字節跳動、快手、酷狗也在做一些嘗試。我們提前佈局了很多年,基本現在是國內看硅谷,Google和Facebook看小冰。所以,我覺得完備性和對未來的判斷,我覺得是我們最主要的優勢。

央廣網: 你預測,什麼時候人和虛擬人類之間交互的時間會變得更長?

李笛:今天全世界範圍內人和人工智能交互的60%都在小冰框架裡,現在的移動互聯網已經到了一個很大的瓶頸,人的內容產生像抖音、快手人的內容產生和人的本身的交互差不多已經到了極致了,所以我們纔有流量紅利消失這個問題,這實際上反過來給AI發展的機會,我覺得未來一兩年、兩三年我們就會看到大量人工智能出現。

Harry講過,未來人、人工智能還有世界是三元的,也有人講是四元世界,除了機器人之外,還有信息世界,人和物理世界。從機器學習爆發的10年來,頭8年世界上AI的主體,人工智能的主體就那麼幾個,Siri、Alexa之類的,絕大部分人工智能主體都在最近在這兩年誕生,所以現在是在一個快速井噴的過程,只不過許多人們還沒有注意到而已。