WAIC觀察丨大廠決勝無人區:大模型的確定方向與未知路徑

21世紀經濟報道記者白楊 上海報道過去幾天,2024世界人工智能大會(WAIC)的火熱程度像極了上海的天氣。

據官方數據,截至7月6日下午2時,大會線下參觀人數突破30萬人次,同比上屆增長90%,創歷史新高。

自2018年創辦以來,世界人工智能大會已經成爲AI產業發展的風向標。而大模型無疑是整個行業近兩年最核心的發展方向。

在2024WAIC上,中國工程院院士、之江實驗室主任、阿里雲創始人王堅表示,“今天的人工智能有別於過去的人工智能,跟過去五六十年都不一樣。人工智能有一個非常長的過去,但是有一個非常短的歷史,長到可以追溯到100多年以前,短到就是過去七八年GPT出來,而GPT的潛力還沒有被完整探索。”

在他看來,未來十年將是非常激動人心的十年。

“只要有新的技術,一定會有新的大公司出現。如果一個新的技術出來,沒有新的大公司出現,那它是不是顛覆性的技術是要打個問號的”。王堅相信,在這個時代一定會有新的大公司出來。

這也是許多人的共識。2022年底ChatGPT橫空出世後,有公司開始用大模型重塑自家產品,也有人感到時不我待,投身新一輪創業,而他們有着相同的目標,就是爭做大模型時代的弄潮兒。

正因如此,大模型也成爲當前最具活力的產業領域。從去年激烈的百模大戰,到今年層出不窮的各類落地產品,大模型的故事纔剛剛開始,而WAIC,正是這場註定宏大的敘事中的一個縮影。

Scaling Law依然奏效

自OpenAI於2020年發佈1750億參數的GPT-3以來,大模型性能上限已發生天翻地覆的變化。尤其是去年大量中國企業的入局,進一步加速了大模型在中文領域的迭代速度。

在2024WAIC期間,許多大模型新品也首次亮相。比如商湯科技帶來了多模態交互大模型日日新5.5,階躍星辰則發佈了Step-2萬億參數語言大模型、Step-1.5V多模態大模型、Step-1X圖像生成大模型等三款新品。

談及大模型未來的發展,階躍星辰創始人、CEO姜大昕表示,探索AGI路徑,“Scaling Law”和“多模態”是相輔相成、缺一不可的兩個方向。

近年來,GPT系列模型的演進,客觀上驗證了Scaling Law (尺度定律)的有效性,即模型參數量決定模型能力的上限。雖然業內圍繞“Scaling Law還能走多遠”尚未形成共識,但姜大昕認爲,參數量接下來再提高一個數量級是依然成立的。

“Scaling Law 目前依然奏效,模型性能仍在隨着參數量、數據量和計算量的增加呈冪次方增長。在此發展過程中,萬億參數量已經成爲一個基本的入門門檻。”他說。

與此同時,姜大昕也強調,多模態是構建世界模型的基礎能力,是通向 AGI 的必經之路。“從算法角度看,世界模型的演進會分爲模擬世界、探索世界、歸納世界三個階段,而多模態是貫穿這三個階段的基本能力”。

目前,全球科技巨頭也都在積極推進多模態大模型的研發。騰訊集團副總裁蔣傑也表示,大模型行業正經歷從單模態到多模態,再到全模態的演進。

“比如在文生圖領域,最近效果比較好的是採用 DiT 架構的模型,它融合了早前主要用於文本生成的Transformer架構,並在圖像和視頻生成任務中展現出了顯著的優勢;在文生視頻領域,視頻生成正朝着更高分辨率、更長時長、更精細的方向發展,一些較好的模型已經能夠生成長達數分鐘高清的視頻,帶來了廣闊的應用想象空間。”蔣傑介紹道。

但多模態大模型的發展仍存在桎梏。姜大昕指出,“目前視覺的理解模型和生成模型是分開發展的,其造成的結果就是理解模型的理解能力強而生成能力弱,或者生成模型的生成能力強而理解能力弱”。他認爲,多模態大模型接下來面臨的一項關鍵挑戰,就是能否將理解和生成統一在一個模型裡。

但整體而言,大模型未來的增長路徑已然清晰可見。清華大學計算機系長聘副教授、面壁智能首席科學家劉知遠表示,“摩爾定律揭示了集成電路可容納晶體管數目約每隔18個月便會增加一倍的規律,在過去幾十年中給半導體和互聯網行業的發展帶來了科學指導意義”。

在大模型時代,傳統的摩爾定律已經失效,因此劉知遠提出了一個新“摩爾定律”:大模型的知識密度(知識密度=模型能力 / 推理算力消耗)平均每8個月將提升一倍。

當然,新摩爾定律目前只能代表大模型過去的發展規律,未來能否按照這一規律繼續發展,還有待觀察。但不管怎樣,可以確定的是,大模型距離性能天花板仍很遙遠。

努力成爲千萬DAU產品

相比大模型能力的進化,今年WAIC更大的看點是大模型的落地應用。

蔣傑表示,場景應用會成爲未來大模型的決勝要素。但他指出,當前大模型的落地主要集中在生產工具和提效方面,距離真正的業務創新還有一定距離,缺少殺手級的應用,不過行業的探索一直沒有停下。

以騰訊爲例,其內部已有接近 700 個業務場景接入了騰訊混元大模型,單日調用量近3億次。此外,今年5月,騰訊也面向C端用戶發佈了擁有看、聽、說等多模態交互能力的AI原生應用騰訊元寶。

事實上,今年以來,幾乎所有頭部大模型廠商都發布了面向C端用戶的AI助手產品。金山辦公助理總裁晁雲曈向21世紀經濟報道記者表示,目前來看,AI助手是比較適合大模型現階段發展的產品形態。

去年11月,金山辦公對外發布了AI辦公助手WPS AI。相比其他獨立的AI助手產品,WPS AI主要嵌套於WPS產品當中。今年WAIC期間,WPS AI也宣佈升級到2.0版本,在原先的產品功能基礎上,WPS AI 2.0新增了AI寫作助手、AI閱讀助手、AI數據助手、AI設計助手等功能。

晁雲曈表示, AI很多能力要想落地,還是需要在用戶應用場景裡合理地嵌入AI,所以金山辦公在走的路徑就是儘量避免追求一鍵生成、一步到位,而是在用戶習慣的環境裡做嵌入。

此前,有多位業內專家均向記者表示,生產力工具或是大模型在C端最先成熟落地的場景。因此除了金山辦公,釘釘、飛書等協同辦公產品也都在大模型重塑產品能力,相對而言,這些辦公產品的用戶對於AI能力的接受程度以及付費意願都比較高,這也讓他們的大模型商業化路徑變得清晰。

除此之外,其他大模型廠商也在摸索更多用戶可能高頻使用的場景。比如在2024WAIC期間,阿里巴巴達摩院發佈的一站式AI視頻創作平臺“尋光”,是希望爲用戶提供視頻創作工具;百川智能發佈的AI健康顧問,則是希望去滿足用戶的醫療問診需求。

據21世紀經濟報道記者現場測試,在用戶提出問詢後,百川智能的AI健康顧問能夠根據用戶的問題持續提問,進而從更多維度去了解用戶病症信息,然後再進行綜合判斷,給出診斷結果和用藥建議。

有醫療行業人士向記者表示,目前大模型在醫療場景中的應用,要分清諮詢和診斷的區別,現階段,大模型扮演角色的仍然是建議者,而不是決策者。

京東探索研究院院長何曉冬在接受21世紀經濟報道記者採訪時指出,大模型的顛覆性、殺手應用,不可能從通用大模型的優化中產生,必然是技術進步與產業積累的結合。

今年,有多位頭部大模型廠商人士在接受21世紀報道記者採訪時,都提到了1000萬DAU的指標。在他們看來,當下大模型應用仍存在非常嚴重的同質化,接下來各大廠商都要去尋找差異化優勢,與其他產品拉開差距,然後擴大用戶規模,而1000萬DAU(日活用戶),將是衡量一款大模型應用是否成功的關鍵指標。

產業場景是沃土

除了C端應用外,大模型在B端的落地也在如火如荼地進行中。

騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲向21世紀經濟報道記者表示,大模型的打造只是起點,把技術落地到產業場景、創造價值纔是目標。

對此,何曉冬也認爲,通用大模型只是種子,產業場景纔是沃土。

他指出,大模型的基礎設施建設已經趨於完善,已經有巨大的資源投入,很快產業應用就會向大模型要實效。而大模型必須產生實際的產業價值、讓產業願意買單,才能長久地發展下去。

何曉冬還從數據角度談到,GPT-4是30%的合成數據,GPT-5將會是 90%的合成數據。這說明能用於大模型訓練的真實數據正在枯竭,而數據的富礦在於產業場景,只有讓產業用上大模型、持續以數據反哺,才能支撐大模型對數據的持續需求。

因此,包括騰訊雲、阿里雲、京東雲等在內的雲廠商都在圍繞大模型的產業場景積極佈局。去年,各個廠商更多是圍繞大模型研發提供服務,而今年,服務則不斷深入業務當中。

據吳運聲介紹,騰訊在大模型領域已經構建了一套全鏈路產品矩陣,涵蓋從底層基礎設施到頂層多元智能應用,包括自研通用大模型、模型開發平臺、智能體開發平臺,針對不同場景定製的智能應用解決方案等。

比如今年5月,爲了降低大模型的使用門檻,騰訊雲發佈了“大模型知識引擎”、“大模型圖像創作引擎”和“大模型視頻創作引擎”三款PaaS工具。在2024WAIC期間,騰訊宣佈已對這三款工具進行全面升級。

其中,知識引擎的多模態檢索能力得到增強,支持圖文互搜、以圖搜圖,並擴展了企業知識類型的覆蓋面;圖像創作引擎新增了商品背景生成、百變頭像、模特換裝、百變換裝和線稿生圖等接口;視頻創作引擎則推出複雜舞蹈編排算法,用戶上傳一張圖片,就可以讓人物進行轉身舞蹈。

相對於C端場景,B端用戶對於大模型的應用要求會更爲嚴格,而通用模型很難滿足這些要求,所以結合行業場景進行模型精調,也是目前大模型產業落地的重要路徑。

大會上,騰訊聯合上海交通大學發佈的《2024年AI大模型十大趨勢》報告指出,算力底座、推理分析、創意生成、情緒智能、智能製造、遊戲環境、移動革新、具身智能、開源共享、人機對齊等將是大模型的重要發展趨勢。

報告稱,從算力底座、智力增強到人機協作,大模型正在重塑人類社會,成爲可依賴的"外腦"。未來,隨着大模型與人機協作的深入,每個企業、每個人都有機會藉助AI外腦實現自己的創意,實現智力平權,而這一變革將爲社會各階層帶來了前所未有的機遇。

然而,大模型的發展仍面臨諸多挑戰。比如隨着模型參數量越來越大,算力和數據支撐能否跟上?在落地過程中,大模型的準確性如何進一步提升,去滿足更多產業核心業務的需要?以及大模型該採用怎樣的商業模式,何時才能跑通?

2024WAIC已經落下帷幕,但大模型的前進腳步並未停止。展望未來,人們將滿懷憧憬地期待着大模型在各個領域的深入應用,帶來更多前所未有的變革與驚喜。