周鴻禕:應結合企業場景打造專業化大模型

來源:睿見Economy

2024清華五道口首席經濟學家論壇於9月28日在北京舉行。360集團創始人、董事長兼首席執行官周鴻禕出席並演講。

周鴻禕指出,大模型會重構每個行業和每家公司。中國公司不用等到超級通用人工智能做出來之後再應用,而是應該充分發揮工業門類多,企業場景豐富的優勢,結合企業場景打造專業化大模型。

以下爲演講實錄:

周鴻禕:在座的諸位,像王小川、孫老師都是人工智能的信徒,因爲對人工智能現在還是有很多爭論,到底大模型是人工智障還是真正的智能?包括美國也涌現出了一些爭論,到底GPT-5能不能出來,包括人工智能是不是泡沫?是不是需要6000億美金的收入規模才能證明?所以,我的觀點還是講,大模型已經實現了一個智能的突破,而且會是一場工業革命。但是,我不會像網上那麼悲觀,說它會摧毀什麼行業,我覺得它會重構每個行業和每家公司。

大模型最近的一個重大突破,我在今年7月份已經開始思考這個問題,就是從人類的快思考能力,變成了慢思考的能力。今天一個再牛的人,要求他不假思索地現場回答一個複雜問題,不打底稿,沒有紙張的介入,不分步,快速回答問題答案的能力都是有限的。

但是,我們人類解決複雜問題的時候實際上是分成多步,比如老師讓寫個論文,我總得先擬個提綱,去查點資料,再找別人看一看,再到處抄襲抄襲,反正最後寫完的文章再潤色一下,你會發現分成很多步,這實際上是慢思考的能力。

最近Open AI發佈了o1,給大家又帶來了信心。因爲原來自己使用GPT的時候就覺得人工智能就這樣,還經常疑問是不是產生幻覺,是不是出錯,感覺GPT像一個死記硬背的學生,但是o1很不一樣。很多人在談強化學習,這個肯定要向幾位老師請教了,我也不太懂強化學習。我覺得用多種方法,最重要的是實現思維鏈的能力,也就是慢思維的能力。所以,這樣的話,我覺得人工智能又找到了新的發展方向。因爲傳統的模型,對於算力,對於顯卡,對於能源,對於數據的大力出奇跡的方式實際上已經是碰到瓶頸了,因爲訓練數據用得差不多了,所以o1開始考慮用強化學習合成高質量數據的方法開闢了新範式。

奧特曼最近發了一篇文章,我仔細看了看,他這個文章看起來樂觀,實際上是悲觀,說人類經過幾千天就能實現突破。猛然一聽很樂觀,我一算幾千天,大概還得十年。所以,我自己覺得比較樂觀,我覺得中國其實可以走一條路,就是不用等到一個超級通用人工智能做出來之後再來應用,而是充分發揮我們工業門類多,企業場景豐富,應該結合企業的場景打造專業化的大模型。

另外,慢思考不是隻有學習一種方式,我們最近半年探索的專家模型協同的COE方法,我跟國內16家大模型廠商合作,接入了50多個大模型,我們嘗試,比如說,王小川的模型負責回答問題,百度的模型負責來挑戰,千問的模型負責來辯論,最後可能字節的模型來負責總結,通過幾個大模型像一個幕僚參幕團一樣這種,通過相互的討論也能實現基於協同的慢思考,解決複雜問題的能力,而且將來在很多問題上超過了GPT-4o,可以看一看演示。

(大模型演示)

最後分享一個簡單的故事,前一段網上流傳一個視頻,Google的前CEO埃裡克·施米特有一個對話,視頻標註爲他故意開玩笑表示爲“保密”,結果反而傳播量很大。所以,我們今天這個會也是保密的,對吧?(笑)。國內熱炒了很多,其實我倒不喜歡施米特的一些言論,我覺得那個主持人的言論特別棒,但是大家沒有注意到。斯坦福的一個教授解答了一個故事,也解答了我的一個疑問。他就說到底工業革命如何發生的?他講當年蒸汽機被電動機取代的時候是經過了30年,最早的時候簡單地拿電動機取代蒸汽機,因爲沒有改動工廠的格局和傳統機構,整個的業務鏈條。所以,並沒有帶來效率的本質提升。因爲最早的工廠都是一個蒸汽機通過傳送杆把動力傳給整個工廠。所以,整個工廠是以這個中心驅動來設計它的整個的架構。

後來30年之後人們突然意識到,電動機可以做小,做成很多個電動機,所以工廠裡各個傳送帶,工廠裡各個動力驅動裝置都用了不同的電動機,從中心驅動變成了單元驅動,整個工廠的格局、流程,包括管理、組織機構都發生了變化,才帶來了電動機驅動的工業革命。所以,我覺得這個例子特別恰當。就是我們今天不能就技術論技術,一方面我跟大家分享了最近人工智能上碰到一段徘徊期之後的一個新的關於思維鏈突破。

第二個,我最愛舉的一個例子就是大模型不是產品,只是能力,還有大模型不是操作系統,全世界只需要兩三套,大模型更像電動機,就是它可大可小,可快可慢,無處不在,最後在中國衆多的使用場景中,每個人的加強可能會有多個大模型,你的手機、車、電腦,包括你們家的人形機器人,你們家的智能硬件都會有大模型。在每個企業裡也不會有一個大模型解決所有的問題,所謂的中心驅動,而是叫單元驅動。就是每個企業的不同部門,它的不同業務的不同流程中會有多個專用的大模型在解決各自的問題。這些大模型像人類專業員工一樣,通過一個組織的能力進行協作,進行相互的剛纔說的這種交流、討論、反思、辯論,最後總結出正確的答案。所以,這種模式很有可能針對大模型,能夠避免我們今天遇到的所謂模型能力不足的問題,能解決所謂模型能力容易出錯的問題,解決一個我們現在最卡脖子,就是算力芯片不足的問題。

時間有限,下來再跟大家分享,謝謝大家!