智見丨專訪周鴻禕:頭部公司才做大模型 大部分人得專注場景
出品|本站科技《智見訪談》
作者|趙芙瑤
編輯|丁廣勝
大腦是如何工作的?我們能否設計一個機器來模擬大腦?
這是1956年,信息論創始人克勞德·香農與發明Lisp語言的約翰·麥卡錫在《自動機研究》開篇提出的問題。如今,Chat GPT使人工智能技術在擬真度和功能維度方面達到新高度,人工智能似乎與真正的大腦之間的距離開始無限接近。
生成式人工智能帶來的全面智能化是一場深刻的革命,企業的治理運行邏輯也或將隨之發生深刻變革。
在此背景下,互聯網巨頭們加碼AIGC,紛紛表示想要打造“中國版ChatGPT”。放眼望去,清華系智譜AI宣佈開源ChatGLM-6B大模型,百度也終於發佈“文心一言”大模型。基於這個話題,360公司創始人、董事長兼CEO周鴻禕高度關注,在兩會期間,他將“國內AI大模型的技術創新和創新模式”寫進提案。
在周鴻禕看來,人工智能會帶來一場工業革命,可以重塑甚至顛覆衆多企業的現有模式。“GPT已經給大家相當於指明瞭方向,大力出奇跡。”周鴻禕在接受本站科技專訪時指出ChatGPT具有無限可能,並對於ChatGPT的未來發展展開大膽想象。
談賦能傳統行業:ChatGPT可重塑企業生態鏈
今年政府工作報告提出,要加快傳統產業和中小企業數字化轉型,着力提升高端化、智能化、綠色化水平。
以“專精特新”爲代表的中小企業是數字經濟發展的主力軍,然而在數字化轉型的浪潮中,許多中小企業面臨着成本受限、轉型能力不足等挑戰。
作爲一名曾經的創業者,周鴻禕非常能理解中小企業以及小微企業的艱辛,他認爲在中小微企業轉型數字化過程中真正做到一個也不能少,才能實現數字化戰略的共同富裕。“數字化浪潮來的時候,我曾說所有的行業值得重做一遍。實際上重做的難度還是很高的,要採集大數據,建立自己的大數據中臺,做大數據分析模型,用數據來進行決策,將所有傳感器都物聯網化,這樣成本很高。”周鴻禕道出了傳統企業的轉型難題。
同時周鴻禕指出,ChatGPT無疑爲企業提供了一條新的思路。“現在很多企業如果用ChatGPT進行生態鏈重塑就比較容易,只需購買SaaS服務,並把SaaS服務跟現在已有的業務流程進行結合。寫稿時如果覺得江郎才盡,可以和ChatGPT聊聊天,或許會腦洞大開。”
周鴻禕堅信,人工智能重塑各個行業、各個企業。目前周鴻禕要求其公司每個團隊都得做APP的部署,無論是To B、To C都應該涵蓋。假設擁有了強大的大腦後臺,將雲服務引到APP中,軟件一定會煥然一新,而ChatGPT無疑是產業革命的加速器。
談打造中國版ChatGPT:產學研需“珠聯璧合”
ChatGPT背後最爲核心的技術,是深度學習的多層變換器Transformer、即GPT中的“T”。其模型也並非完全原創,但是最終產生了1+1>2的效果。目前,對於前沿科技領域,國內很多研究機構還處於追隨模仿階段。
周鴻禕指出國內企業最終還是要靠自主創新,在學術上有所突破。“前沿的人工智能模型和算法,很多都不是我們原創的,這需要科研機構的努力。同時,單單靠研究機構也不行,必須效仿OpenAI與微軟的模式,讓研究機構與產業化公司深度合作。”
周鴻禕認爲,人工智能大模型的成功一部分是技術,一部分是產品體驗,還有一部分是工程化,其中存在許多環節,包括內容的調度、數據的篩選、工程師的標註、人工的訓練。而研究者往往容易忽視工程化,這是錯誤的做法。
在他看來,而這需要進行結合與互補。“搞工程化的公司有時往往又覺得搞研究的人想得太理想主義,所以我認爲這次人工智能大模型的成功應該說是微軟和OpenAI之間珠聯璧合的合作起到了決定性作用。微軟提供算力、工程師,幫其解決工程化的問題,而產業化公司比較擅長的是用戶體驗。此外因爲大模型訓練的成本很高,如果找不到商業模式,是難以爲繼的,而這也是產業化公司擅長的。”周鴻禕指出了二者各自的優勢,同時也挖掘出了其合作模式。
在周鴻禕看來,微軟承接了許多屬於產業化公司擅長的工作,使OpenAI可以專注於技術研究,雙方在資本上又進行了很好的結合,這給予了我們啓發,中國可以將大學、國家實驗室、科研機構、科研體系和互聯網公司、產業公司結合起來,通過合作的方式來推進。
“別人已經領先了,我們不能再把別人踩過的坑再踩一遍。”周鴻禕感嘆道。他認爲首先可以建立大型科技企業+重點科研機構的產研協同創新模式,打造中國的“微軟+Open AI”組合引領大模型技術攻關;其次可以支持設立多個國家級人工智能大模型的長期開源項目,打造開源衆包的開放創新生態。建立大型科技企業+重點科研機構爲龍頭,通過開源、合作、衆包和生態的創新模式,引導高校、科研機構和創新型企業形成多個技術路線的創新生態羣。這樣一來,可以降低錯誤風險和防止技術壟斷風險,避免其變成新時代的數字鴻溝。
談與國外差距:原創性有差距,兩年有望趕上國外
“我覺得中國和國外的差距沒有那麼大,比光刻機芯片差距都要小很多,主要原因是這方面的論文都是開放的,很多模型算法原來都是開源的,相當於我們有基礎。GPT已經給大家相當於指明瞭方向,大力出奇跡。但是,我覺得這裡有很多細節的技術問題,比如灌輸知識是容易的,但能力和推理能力,包括各種實際技能的訓練較爲複雜。所以我認爲大概需要兩年左右的時間,國內的水平就可以趕上來。”談及我國的AI企業在資金、人才、底層技術等關鍵環節與國外存在的差距,周鴻禕這樣回答道。
周鴻禕還提出,中國和微軟、Google的差距,從模仿角度來看差距不大,從原創角度差距仍然存在。“我們面臨幾個不利的條件,就是我國缺乏開源的傳統,它裡面用了很多模型都是前面的公司開源的,沒有前面的開源就沒有在前人肩膀上的積累,每個公司都要從黑暗中摸索,這對國家整個產業發展速度是不利的。這麼牛的技術,也確實不應該被壟斷在一兩家公司手裡。”
他還指出我國目前存在的一些難點。他指出,爲了實現對GPT的超越,需要使用更多的數據,而不僅僅是開源數據集。這包括大量的雜誌、期刊和圖書。公共數據是非常重要的,因爲GPT對時效性的要求並不高,它可以使用很早以前的書籍或文章。但周鴻禕也指出數字化的問題是一個難點:“如果大量的中文圖書沒有數字化,或者沒有一定版權的授予,這個版權授予如何進行、國家如果沒有政策支持,那麼數字化的難度會更大。”
除了版權之外,周鴻禕認爲互聯網的信息也非常重要,互聯網有上萬億個網頁,其中有很多都是電子垃圾,這就需要搜索引擎進行調度、處理、過濾和清洗。“但是中國出現一個怪現象,喬布斯發明了APP,大家用習慣了就不怎麼用網站了,但是美國還有一個傳統,所有的APP背後還有一個Web版本,還是保持了Web化的瀏覽體驗,這樣的話這些不涉及用戶隱私的數據可以被抓取可以用來做訓練,但在中國所有的信息都被APP分割了,APP人爲的將互聯網分割成了各種信息孤島。如果你的數據我拿不到,我的數據也不給你,最後大家訓練出來的能夠真正超越嗎?我覺得會比較難。”
同時周鴻禕也規劃了一條企業可以選擇的路徑,他認爲打造生態至關重要,ChatGPT目前表面上來看,是打造了一個聊天機器人、個人助理來幫助大家更好的使用工具。而實際上它做了一項工作:秘密挑選了一百家專業公司並扶植其做專業的垂直應用,這一百家公司大部分均爲創業公司。
“頭部企業才需要搞大模型,大部分企業只需要在大模型的基礎上,結合自己的行業場景、專業需求,利用大模型提供AI的能力來賦能自己就可以了。所以,對於很多創業企業應該是一個蓬勃發展的機會。”周鴻禕向本站科技表示。
同時周鴻禕也強調,ChatGPT被稱爲通用人工智能是因爲它構建了一個通用的知識基礎,可以爲不同的行業和應用場景提供支持,而不是隻限於某一個垂直領域。這也是它的產業革命的價值所在。雖然在中文語料方面,ChatGPT的中文表現不如英文表現好,但這是因爲中文語料的比例非常低,大約只有百分之幾。這意味着要訓練更好的中文模型,需要更多的中文語料。
展望未來,周鴻禕認爲在追趕美國的過程中,我們要先把自己的“疑難雜症”解決,如果想在一片土壤上長出幾棵蒼天大樹,要長出生態,就先要把土壤環境機制創造好。