專訪戴文淵:AI應該像Windows一樣 讓大衆也能用

本站智能訊12月4日消息,第四屆世界互聯網大會昨日在烏鎮開幕。會議期間,國內AI初創企業第四範式發佈了企業AI核心系統"先知"3.0版本,大幅降低了人工智能應用的開發門檻。不同於先前版本的全流程學習平臺,先知3.0包括數據、算法、生產三個核心,能夠幫助AI技術進入企業決策層的核心繫統,也就是幫助企業建立自己的AI應用技術。發佈會後,第四範式CEO戴文淵接受了本站智能的專訪,談及他如何打造了AI時代的Windows系統。

以下戴文淵專訪實錄:

記者:先知3.0系統相比之前的版本最大的改變是什麼?

戴文淵:先知產品是去年7月20號第一次對外發布,但其實當時的版本已經是2.0版,因爲之前1.0版已經在某全國性股份制銀行適用。

今年3.0版先知最大的一個定位改變,是把先知定位成“企業AI核心系統”,爲什麼要這樣子改變?是因爲我們越來越發現企業需要不僅僅是一個算法或者一個系統。一直以來,第四範式在做的事情都是要降低企業使用人工智能的門檻。在早期,我們把先知的目標設計爲降低算法門檻和系統的門檻,所以一直到先知2.0,先知的定位都是低門檻的機器學習開發平臺、低門檻的人工智能應用開發平臺。

但是我們發現這樣仍然不夠,一個企業如果想要很好地應用AI能力,除了要降低機器學習的門檻外,外圍還有很多的工作要做,所以先知又擴展了自己的外延,我們打通了從數據到業務的閉環,將機器學習產生智能的能力,與業務環節連接,形成了一個“機器學習圈”。圍繞着“機器學習圈”,我們重構了整個先知的使用方式,讓企業能夠更清晰、更便捷地產生智能應用場景,這就是先知3.0想要達到一個效果。

記者:我們是如何選擇客戶的?目前爲什麼選擇金融和醫療這兩個領域?

戴文淵:我們的目標一直都是要幫助全行業惠享人工智能的福利,我們的願景是AI for everyone,我們並沒有說主攻哪個行業,當然現在來看有些重點的方向,比如說像金融、互聯網、醫療,這些是我們更重點來關注的企業,但是我們並沒有說只是做某一個行業。

其實從行業來說,金融是個很特殊的行業,金融並不是一個具體的行業,金融和科技一樣,都是能夠去服務其它每一個行業的,一個企業既需要金融的支持,也需要科技的支持,我們先服務好金融,也是我們服務好其他行業的一個基礎,當我們服務好金融以後,我們其實可以切入到其他的行業,再切入到其他行業的時候,我們會使用科技和金融結合的方式去服務這些企業。

記者:先知3.0是要打造像TensorFlow這樣的系統嗎?這個理解準確不準確?我們跟他們差異是什麼?

戴文淵:實際上我們比TensorFlow要寬得多。今天我們把先知定位成企業的AI核心系統,這個核心系統其實會有三個核心——數據核心,算法核心,還有生產核心。我們算法核心裡面會分這麼幾個層面,一個是低門檻的算法,其核心算法是由我們自研,第二部分是我們也會充分地去集成各種各樣開源系統,TensorFlow相當於是其中一部分。所以我們的產品並不僅僅是一個TensorFlow,而是幫助企業構建一個完整的智能能力的閉環,這個智能能力的閉環當中,可能會有一個環節,如果企業想用TensorFlow,就可以把它接入。企業可能在這個環節需要使用的不是TensorFlow,所以我們還配會有更低門檻的算法,會更適用一些業務人員去開發機器學習。

記者:我們給企業提供AI的時候,我們爲什麼想把這個門檻降低呢?因爲在我看來好像人說專業的人做專業的事情,我們其實降低了門檻,也不可能真的讓行政每天過來做開發?

戴文淵:其實真的未見得,我跟你說一個誇張的事,我們公司的行政都能開發AI,當然前提是在我們這個平臺上。假設您有個APP,我能把它變成千人千面,這個門檻已經低到今天不需要一個科學家來做,在先知上面,哪怕是我們公司的HR、行政的同事都能夠做。

記者:你們最終目標是什麼?

戴文淵:爲什麼幹這件事?因爲未來AI應用應該是遍地開花,但科學家是少的,科學家一定是小衆人羣,從來沒有說世界上有一大批人都是科學家,所以如果要依賴科學家去做應用,AI一定不能發展起來。所以未來我們希望這些應用背後都是由AI驅動,就必須要讓大衆能夠去掌握人工智能的能力,這個時候就不叫專業的人做專業的事了,或者說未來在這個專業應該有更多的人。就好像現在的民航的飛機,經過培訓的飛行員都可以飛,而最早萊特兄弟的飛機只有他們自己能往上飛,這就是很大的差別,所有科技都是需要慢慢朝大衆化方向發展。就像汽車,現在考個駕照不那麼難,仍然有人沒有能力去考駕照,但是如果無人車出現了,那就沒有駕照也可以了。

記者:不同的行業,它的數據採集標準應該是不一樣的?

戴文淵:對,不同的行業標準不一樣,我們定義了產生AI能力的數據的採集標準,並且我們提供了工具,然後能夠幫助企業正確採集到AI所需要的數據。比方說金融領域反欺詐場景,過程數據我們要採集交易授權,反饋數據我們要採集投訴。

記者:之前我跟您聊的時候,先知還在2.0時代,您說您先知系統要打造AI時代的一個windows,現在做到了3.0版本,距離這個理想到還有多遠?

戴文淵:其實更近了一步,在先知2.0就好像沒有資源管理器的windows,雖然我們提供了核心的計算能力,核心的數據儲存能力,但是在之後和客戶磨合的過程當中,我們發現需要更多地關注資源有沒有管理到位,數據有沒有提供正確?所以爲什麼我們今天要把整個閉環管理起來,這樣我們會更容易能夠去提供出一個準確的AI應用。

記者:你們的商業模式是怎樣的?

戴文淵:百度可以把語音識別免費,但是百度不能把百度雲免費,一個是邊際成本爲零的事情,一個是邊際成本不爲零的事情,未來所有的邊際成本爲零的事情都是免費,但是邊際成本不爲零的事情不會免費。

記者:很多互聯網巨頭都在打造自己的AI平臺和系統,先知系統在我看來就很特別,但與其他的AI平臺有什麼不同?

戴文淵:我們的目標是降低企業使用人工智能的門檻,但是我們一直在調整產品,目的是提供更多的服務。我們不是一定要去跟別人去對比說,你也是平臺,我也是平臺。講平臺是一件很容易的事,我做什麼東西都可以說自己是平臺,關鍵不在於是不是平臺,關鍵在於你在解決什麼樣的問題。因爲我長期在幫助企業去構建AI的能力,我會發現其實很多企業,它其實構建AI能力非常困難,這個困難體現在很多地方,包括算法的層面,包括系統的層面,包括認知的層面,今天我們已經解決了很多問題,但是其實我們仍然需要解決更多的問題。

記者:如果比如說有一個企業它想用你們的系統建立AI自己的核心繫統,它提供的數據,如果想用語音的模塊,還有視覺的模塊,這個東西是你們來提供還是他們可以接其他的平臺?

戴文淵:語音和視覺是先知3.0可以產生的模型,我們的系統構建一個語音識別的閉環,就可以產出語音識別的能力。在這個語音識別的閉環中,“行動”就是語音識別的一個過程,“反饋”就是說識別結果對還是不對,然後基於這兩部分數據,機器學習就可以產生一個語音識別的模型。其實我們已經在幫助企業構建像手寫識別的能力,人臉識別的能力。我們不一樣的地方,是我們讓我們的客戶自己擁有產出了機器學習的能力,而現在市面上絕大多數AI公司,你不需要有機器學習的能力,你買我的服務就行,這是完全不一樣的產品定位。

記者:假如說我有一個公司,我就覺得現在公司考勤這個環節,就特別地麻煩,因爲現在考勤有各種各樣的刷指紋,如果我用你這個可以怎麼解決?

戴文淵:如果識別人臉就這樣,您把您公司內所有人的照片給到我,並且每個照片對應的是什麼樣的人,輸入到我們系統裡,就生成了一個您公司的人臉識別模型。不過這個模型非常針對於您公司特定的問題,不是一個通用的人臉識別的問題,不能識別別人公司的人臉。而是隻能解決你們公司的問題。

記者:企業利用先知系統自己做,跟我們去買一套方案相比的話,哪一個成本更低?

戴文淵:其實有兩種解決方案,一種是咱們買別人的,就是找一撥人來替我做。另外一種我自己做,我自己做的話,其實門檻最大的問題,我能不能招到足夠的人才去做這樣的事情?如果說我採購一個平臺,以後我就自己能做了,那其實是一個非常好的一件事,因爲實際上應用會非常非常多,過去可能沒有人做。比如在我們與某全國性股份制銀行的合作中,銀行內部員工就利用這套AI核心系統在其它20多個日常的運營業務場景中提升效率、發揮價值,有很多場景是這在沒有這個系統之前是不會想到去優化的。

其實,先知系統的方案成本一定是更低的。不過我認爲目前AI最大的問題還不在於成本,或者是怎麼降低成本,最大的問題是沒有足夠多的人去做,AI應用方面其實能想到的方向與場景特別特別多,做都做不過來,但是因爲只有一部分人會做,而那些人現在特別搶手,所以有大量的需求被壓抑着,跟成本相比,我覺得能做是現在更需要解決的問題。

記者:這樣一個企業級的核心繫統,最難的地方在什麼地方?

戴文淵:首先第一點是你的出發點,做企業級核心系統的出發點是,你必須時時刻刻心裡想怎麼去幫助這些企業解決問題,這是前提。其實我們在做這個過程當中,我們關注的不是說我們要推一個什麼形態的平臺,第一點最重要的是要解決企業什麼樣的問題,之後每天都要思考離解決這個問題還差什麼。要解決的問題還差的部分,我們怎麼來幫助。

基於這個出發點,我們發現,企業用AI首先要解決算法的問題。在過去的三年,我們投入非常多的精力研發低門檻的機器學習算法。實際上整個學界並不研究這個東西,學界研究的都是說效果更好的機器學習算法,哪怕說這個效果更好的機器學習算法,全世界只有一個人用,只有效果更好就可以了。而第四範式研究的是什麼呢?假設我的算法跟你的算法哪怕一樣好,但如果我這個算法能有多10倍的人會用,我認爲這個事情是值得去做的事情,這就是圍繞着我們的目標、我們要做什麼。其次,在算法之外,怎麼去定義人工智能的數據標準,以及構建這個數據採集的能力也是很重要的。

讓團隊瞄準企業確實很困難的點,圍繞這些困難不管有多少的問題沒有去解決,我們都要去把這個問題解決,我覺得這個出發點是很重要的。

其實在解決問題的過程當中,我們當然也組建了世界領先的團隊,就像在解決哥德巴赫猜想的過程中會冒出很多世界領先數學家一樣,我們現在也很自豪地說,我們在很多領域,包括在算法層面,特別是低門檻的機器學習算法層面我們是走在世界領先的;在系統架構層面,比方說多維的系統架構,這個多維是多達上億維的系統架構,在這個基礎上還要做到實時處理。實時現在其實已經門檻並不是那麼高了,但是現在市面上所有的實時,都是低維實時,比如說一萬維我做到毫秒級,這並不是很大的問題,但是如果萬億維仍然能做到毫秒級,業界其實也就我們現在能做到。

記者:您如何去維護先知的系統生態,當你們面向一些企業級的用戶做開發者平臺、開發者社區,怎麼去做?

戴文淵:一個開發平臺,上面一定是要有生態的,我們在去年推出了一個計劃,叫做“範式大學”,範式大學的定位是,我們會用四天的時間(今年年初的時候是一個月,到今年下半年,我們把它優化到了用四天),在先知平臺上培養出一個數據科學家,一個合格的數據科學家。當然這還不夠,科學家並不是一個零到一的問題,咱們可以從四天時間從零到一,但是未來他還需要從一到十,從十到一百,所以四天以後我們還會有一個計劃,是“範式大學”計劃的長期版。您通過四天的培訓以後,從零到一,您會結識一個導師,這個導師能夠長期幫助您不斷去提升,這就是在從一到十,從十到一百的過程,永遠都會有一個人幫助你提升,遇到什麼困難的時候會有人在旁邊去提醒你或者點撥你,幫助您最後成爲一個一百分的數據科學家。

記者:您怎麼去定義“範式大學”這種模式呢?

戴文淵:這個模式其實就是,一開始我們有個種子,我們從兩三個人發展到一個三四十人的團隊,現在我們開始有信心能把三四十人的團隊往外開展,讓三四十人成爲更多的範式大學學員的導師,把他們培養起來。未來這些學員當他從一到十、到一百的過程中,很多學員也能成爲導師,我們又可以吸納更多的學員,這樣就慢慢地,整個的AI科學家的團體就會變大。

記者:請您總結一下今年第四範式成果?明年對於先知系統的期待是什麼?

戴文淵:今年其實是一個先知平臺大面積落地的一年,你們如果關注我們公司報道的話,我們最近也有些標杆客戶不斷在落地,基本上來說也都是國內最頂尖的、標杆性的客戶,這是今年做到最重要的一件事情。

明年其實我們需要從標杆客戶往整個世界去覆蓋,所以我們爲什麼也在緊鑼密鼓地去培養我們的生態,因爲要覆蓋整個市場需要的更多的人才。(完)