2024 WAIC:大模型落地考,難點在哪裡?
去年是百模大戰,今年走到了應用的深水區。
“應用,還是應用”,去年都是技術大咖在前臺分享,今年更多是應用的負責人。論壇太多,嘉賓都不夠用了。
這是光錐智能在2024 世界人工智能大會(WAIC)現場最直觀的感受。500+家企業參展,1500+項展品展出,200+位重磅嘉賓演講,這個佔地5萬多平米的會場上人頭攢動,到處瀰漫着對技術落地和應用的關切。
去年的WAIC,行業更關注大模型技術的追趕和突破,那麼今年WAIC則更加聚焦於商業化落地,探索可行的商業模式和盈利途徑。
世界人工智能大會是中國大模型玩家集中“秀肌肉”的一個絕佳舞臺,大會現場展示了上百款大模型產品,不僅有百度文心一言、訊飛星火、阿里通義千問、騰訊元寶、華爲盤古等這些來自頭部廠商的熱門產品,也有Minimax、百川智能、智譜AI等新晉玩家的產品展出。
“人是被忽視的因素,不是企業裡所有人都擁抱AI。小企業把AI當成革命的工具,大企業把AI當成工具的革命。當大企業也意識到AI是革命的工具,變化就會到來。”中國工程院院士、之江實驗室主任、阿里雲創始人王堅在大會上說。
王堅道出的是中國大模型商業化落地的基本現狀。
據《中國新一代人工智能科技產業發展報告2024》,2023年中國人工智能核心產業規模達5784億元,增長13.9%;中國生成式人工智能的企業採用率15%,市場規模約爲14.4萬億元。
與去年相比,今年大模型的應用更加深入,但這依然不夠。
拼應用,大模型廠商使出渾身解數
在大模型剛剛興起時,由於技術和經驗的限制,大模型在落地過程中需要投入更多的資源進行研發和調試,導致當時的落地比較重,不少人也停留在AI 1.0時代的舊思路中。一年過去,大模型廠商的落地策略發生了不小的變化。
首先,在商業模式上更加成熟,新的商業模式也在探索。2023年,大模型商業化處於早期探索階段,主要通過API接口調用付費,面向C端用戶則以訂閱制,嘗試通過PaaS平臺以及MaaS模式進行商業化嘗試。
2024年,隨着產品和工具的完善,再加上大模型的降價潮,讓可商用邁入了一個全新的階段。
另一個變化是,從通用大模型佔主流,到垂直領域大模型興起。
一個大模型沒法解決全世界的問題,更細分、更專業的大模型和應用不斷涌現。在醫療領域,潤達醫療與華爲雲合作研發了“良醫小慧”,螞蟻集團推出百靈大模型,支撐起金融AI助理“支小寶”和AI就醫助理的落地;在教育領域,本站有道推出了“子曰”教育大模型,猿輔導也推出了看雲大模型;“攜程問道”則是旅遊大模型,這些都是垂直趨勢下的產物。
大模型正在從“通用”向着“有用”發展,垂直化、專業化則是表現出的一個必然趨勢。
此外,將大模型與Agent技術結合,也是實現大模型業務價值落地的一個途徑。在中國,已有多家廠商發佈了自己的Agent智能體平臺,這些平臺利用大模型技術,提供從任務自動化到軟件開發等一系列智能服務。
比如,騰訊推出了AppAgent項目,一個通過自主學習和模仿人類行爲在手機上執行任務的多模態代理;字節跳動上線了一站式 AI 開發平臺“Coze 釦子”,可支持 30 秒無代碼生成 AI Bot,集成了超過 60 種不同的插件,覆蓋新聞閱讀、旅行規劃、生產力工具等多個領域;百度也升級了產業級AI原生應用開發平臺“千帆AppBuilder”,大幅降低AI原生應用開發門檻,提升開發效率。
光錐智能瞭解到,基於訊飛星火大模型構建的“星火企業智能體平臺”,已陸續應用到金融、能源、工業、運營商等領域,已與金山等20餘家生態廠商建立互認證生態。推廣市場3個月,累計使用次數已超過500萬次,覆蓋57個企業崗位,單次企業辦事效率提升10倍以上。
爲了儘快落地,大模型玩家對to B和to C兩個方向的選擇截然不同且充滿爭議。
按企業服務領域的慣性來說,大模型to B應用可以帶來更大的行業價值,可以更快實現,但傳統企業普遍不敢用、高管不想用、企業不願爲軟件付費。因此,創新工場創始人、零一萬物CEO李開復認爲,短期來看大模型在中國to C的應用更有機會,但挑戰在於推理成本高,在考慮產品市場匹配度時,還要考慮技術需求、技術難度和成本等因素,而且還需要把握時間窗口。
大模型在B端落地更難,但也不全是如此。過去一年裡,在多數廠商仍處於POC階段時,盤古大模型已在30多個行業、400多個場景中落地,覆蓋了從高鐵巡檢、氣象預報到鋼廠場景仿真、具身智能,再到工業互聯網等場景。
華爲在B端落地的經驗能否複製?坦白說有點難。華爲擁有強大的to B和to G能力是不爭的事實,經驗積累多、資源多,深耕行業多年,亦建有20大產業軍團。另一方面,盤古的快速落地也離不開多年來ISV(獨立軟件提供商)的生態建設,比如中軟動力、軟通動力、南威軟件等,都是深耕各行業的軟件服務商,其他大模型廠商很少具備這些優勢。
大模型玩家並沒有擺脫互聯網領域的發展路徑,爲了快速落地,這一年來大模型廠商也掀起了激烈的價格戰。接近地板的價格雖然降低了開發者和企業的使用門檻,加快了大模型技術的推廣,但弊端也不可忽視,可能引發惡性競爭,造成市場混亂,影響消費者對大模型價值的判斷,長期可能對市場信心造成負面影響。
百度董事長兼CEO李彥宏在大會上說,過去這一年多來,行業處在非常熱鬧的“卷模型”之中,一度出現了百模大戰的盛況,造成了極大的算力浪費。
但卷模型的成果也是顯而易見的,國產大模型的能力躋身世界領先水平。
智譜AI首席執行官張鵬坦言:“(打價格戰)這個階段用戶是獲益的,但是這種事情肯定無法長久,它不是一個正常的商業邏輯。”
除了拼價格,大模型玩家在技術上依然在瘋狂內卷,因爲技術是未來大規模商業化落地的基礎。階躍星辰在會上發佈了三款Step系列通用大模型新品:Step-2萬億參數語言大模型正式版、Step-1.5V多模態大模型、Step-1X圖像生成大模型。
多模態是當前的熱門技術方向,此前華爲雲發佈的盤古5.0也是多模態,規模也達到了萬億級。
當下,在落地這件更加緊迫的事項面前,並非所有的模型都在強調參數。百度最近發佈的文心大模型4.0 Turbo並未明確具體的參數,百度也提到通過技術升級,降低了大模型推理的成本,這意味着百度可能在保持或提高模型性能的同時,優化了模型的效率和資源消耗。
在WAIC展區,光錐智能看到了大模型在各領域的最新成果,拼應用可謂使出了渾身解數。
阿里通義APP以“通義十二時辰——體驗AI助手陪伴的一天”爲主題,圍繞對話、效率、智能體、視覺四大核心板塊進行功能集中展示和互動體驗。參觀者可以體驗“定製個性化聲音”,觀看“動態版韓熙載夜宴圖”,創作“塗鴉作畫個性扇子”等特色打卡互動活動。
螞蟻集團展示的支付寶智能助理是國內首款辦事型的智能助理,用戶不用找入口,問一問就爲你辦事、問診、打車等,不僅“有腦有嘴能對話”,還“有手有腳能辦事”,AI越來越像“掃碼支付”一樣,讓每個人的生活更加便利。
智能終端方面,大會展出了小鵬的AI天璣系統,該系統基於小鵬自研大模型和通義大模型能力,將AI全面應用於座艙和智駕,千人千面,提升車輛的智能化體驗。
在大會上,本站伏羲發佈首個機器人品牌“靈動”,產品已落地50個重點工程項目。本站靈動是本站伏羲基於自研工業大模型和AOP技術思想打造的機器人品牌,旗下的挖掘機器人和裝載機器人兩款核心產品,已參與10多個省份的50個重點建設項目,覆蓋礦山、港口、攪拌站、學校等多種應用場景。
本屆大會展出智能機器人45款,其中人形機器人25款。觀察大模型落地,人形機器人這塊繞不開,人形機器人集成了人工智能、高端製造等先進技術,它將深刻變革人類的生產生活方式。
現場發佈了全球首個全尺寸開源公版人形機器人青龍、國內首個全尺寸人形機器人開源社區、特斯拉Optimus二代產品,同時宇樹科技展示了國內首款實現奔跑功能的全尺寸通用人形機器人H1等。
其中,青龍身高185釐米,體重82公斤,全身多達43個主動自由度,最大關節峰值扭矩400牛米,算力支持400TOPs,支持快速行走、敏捷避障、穩健上下坡和抗衝擊干擾等四大運動功能,是通用人工智能軟硬件開發的理想載體。
特斯拉帶來的Optimus 二代人形機器人比第一代更靈活,可操作的任務更復雜,藉助大模型技術,身體控制能力增強,手指部分搭載觸覺傳感器,甚至能完成抓雞蛋等精細動作。特斯拉在Optimus的落地上頗有雄心:目標年產10億臺,計劃切走市場10%以上份額。據瞭解,Optimus預計在2025年開始限量生產,會有1000+臺在特斯拉工廠協助人類完成生產任務。
各大模型廠商爲了商業化落地做出各種商業模式、使用場景的探索,進行技術的突破,落地和應用比去年更有深度。人羣在眼花繚亂的產品中攢動,興奮之餘,大家最關心的問題還是——大模型如何大規模商業化落地。
看落地,當下的難點是什麼?
據公開數據,截至2024年4月底,國內共推出305個大模型,10億參數規模以上的大模型數量已超100個,大模型廠商的數量客觀,但在落地上還存在不少問題。
“人的因素容易被忽略,當我們講AI對每個部門都會產生影響,AI是革命性力量的時候,要所有部門的所有人都去擁抱AI,這在很多大企業是很難的。小企業跟大企業的差別就是,大企業會覺得AI是工具的革命,而小企業一定會覺得這是革命的工具。”
王堅在大會上說,當大企業也意識到AI是革命的工具,變化纔會到來。
王堅觀察到的現象是中國企業對AI的態度之現狀,讓所有企業都去擁抱AI、擁抱大模型並不容易。中國移動從2023年年初開始啓動大模型研發工作,當年就推出了139億參數的大語言模型,在公司內部和客戶中加快推進大模型落地,但面臨的一大挑戰是,行業如何看待和擁抱大模型,行業內部對於大模型的看法和接受程度不一,存在思維方式的轉變問題。
“我們見行業客戶,他們都會問:大模型到底能幹什麼?能帶來什麼價值?要先從哪些領域開始用?這些對客戶而言都是很現實的問題。”中國移動研究院AI中心副總經理金鏑介紹說,在成本上也存在很多現實問題,比如用大模型需要買多少算力,投多少人做數據治理和訓練模型,需要多少人做運維等等。
“我們今天並沒有找到AI產生如此效果的本質,沒有人能用數學的方法描述它。這就好比鑽木取火,火有用處,但鑽木並非最好的方法。今天的AI依然處在鑽木取火階段,因此成本高昂。”螞蟻集團CTO何徵宇近日表示,在大模型的“鑽木取火”階段,規模落地需要攻堅三大挑戰:可靠性、經濟性、易用性。
在具體的場景裡面,我們可以看到更細節性的問題。
螞蟻集團大模型應用負責人顧進傑在談及“嚴謹產業需要怎樣的AI”時說,領域知識相對缺乏,複雜決策難以勝任,對話交付並非端到端的體驗,這些是行業存在的問題。他們的應對策略是,針對知識缺乏,構建大規模知識引擎;針對複雜決策,讓智能體借鑑人類的思考方式等等。
在大模型落地工業場景方面,施耐德電氣數字化總設計師毛春景提到一個“兩難問題”:由於製造業企業的數據、知識、經驗等無法分享,導致數據流動差,難以出現垂直行業大模型;然而,如果單個企業出面做私有化垂直的微調大模型,又會面臨訓練成本高、維護難度大的問題。
此外,大模型需要進行二次預訓練,對算力的需求非常迫切,目前存在較大的算力缺口,特別是在國產算力方面。算力不足限制了模型的訓練速度和規模,也可能影響模型的最終性能。
總的來看,大模型落地難的直接原因在於客戶側的擁抱程度,接受不接受,經濟不經濟,可靠不可靠等等。而根本的原因還得往大模型本身上找,技術夠不夠好,成本夠不夠低等等。當然,大模型的成本高低也與客戶的規模大小密切相關,模型廠商與客戶是一個互相促進、螺旋式上升的關係。
下一輪能力的最大突破在多模態
有段子說,AI能夠解放人類的生產力,能夠讓人類關心詩和遠方,但是我們現在更多看到是AI在詩和遠方,我們人類還是在做我們原來的這些事情。這個段子一定程度上反映了AI當下存在的問題。
以大模型作爲代表的新一輪的人工智能技術浪潮洶涌澎湃,它的能力究竟如何?在千行百業落地的過程中有哪些新的可能性?新價值鏈的形態是什麼,影響又會如何?一些大模型創業者給出了自己的思考。
MiniMax創始人、首席執行官閆俊傑認爲,GPT 4存在30%~40%的錯誤率,國內大模型整體上存在60%~70%的錯誤率,要想讓AI從一個輔助人類的工具到能夠獨立完成工作,爲社會創造更大的價值,最核心的一點是整體降低大模型的錯誤率。
“當模型的錯誤率變成個位數的時候,即在人類定義的測試上都可以接近人類最好水平的時候,它在實體經濟裡面產生更大的效益就變得更加自然了。”閆俊傑說。
在AI的感知智能時代,AI已經在特定場景的語音識別、圖像識別等指標上超過人類的水平,但離能思考和決策的階段還差很遠,更不用提AGI(通用人工智能)。
“大模型帶來了新的機遇,它能夠在一個模型上提供泛化能力,解決一系列場景和應用的多樣需求,從而解決成本和收益的平衡問題,這是它的本質特點。” 智譜AI首席執行官張鵬說。
對於如何用新一代生成式AI的技術和大模型的技術賦能實體經濟,張鵬認爲,一定要構建更通用的、更基礎的能力,利用這個通用和基礎的能力去解決多新的問題,然後用收益的總和去除以投入成本,一定要從這個方向去解題。
未來大模型要更好地幫助人,更好地落地,下一輪能力的最大突破點會是什麼?張鵬的答案是多模態。
人在現實世界中解決問題時,需要輸入的信息本身就是多模態,除了自然語言以外,還有視覺、聽覺、觸覺、常識等,所有這些要素綜合起來才能解決現實世界中的問題。
所以,大模型的能力在多模態方面的突破,會帶來AI的普惠,爲AI開啓更多的可能性。原來的投入產出是一個金字塔型結構,即投入很大,但是收益很小;只有將它變成一個倒金字塔結構,這樣才能真正放大它的價值。
新技術在催生新的產業變遷的同時,也會構建一個新的價值鏈,AI產業也是如此,從單點爆發到各行業的全方位突破,AI所創造的價值也將是指數級的。
王堅是一個樂觀主義者,他認爲GPT的潛力還沒有被完整地探索,所有的問題要在動態的過程中解決——不能以現在這個時刻的狀態來解決十年以後的問題,要拿十年以後的狀態來解決十年以後的問題。
因此,我們有理由相信,中國大模型在商業化落地中遇到的問題,也必然會在大模型的動態發展中得到解決。