財通證券:計算機行業“AI操作系統”時代已至

財中社12月2日電 財通證券發佈計算機行業專題報告,AI+OS,操作系統級Agent開啓人機交互革命。AI賦能OS,操作系統級Agent由於其C端入口特性,有望成爲首個“爆款”AI應用。當前市場中長期缺乏“爆款”AI應用,認爲主要系C端大衆對AI的感知度仍然較低,儘管有大量可下載、可付費的AI應用存在,但從廣大用戶體驗來講,各類AI軟件對其生活重塑的邊際變化不大。而近期,包括手機端蘋果、榮耀、Vivo等,以及PC端聯想等廠商上新操作系統級Agent作爲新的人機交互形態,以端側入口形式首次深入羣衆,令其“被迫”體驗接受新的操作範式,有望打造首個“爆款”AI應用,由此將帶動AI端側硬件需求涌現,以及刺激軟件內部AI功能快速迭代。

建立交互數據集,深耕Post-Training,獲得“從Chat走向Act”通用Agent能力。智譜的Agent能力主要來源於其底層大模型的訓練與迭代:CogAgent是18B參數的視覺語言模型(VLM),專門用於GUI理解和導航,基於視覺語言模型CogVLM並結合高分辨率交叉模塊,實現了高效GUI推理;AutoWebGLM通過簡化HTML增強網頁閱讀能力,添加人類與AI混合方法構建的網絡瀏覽數據集進行微調,大幅提升大語言模型的Agent能力;AutoGLM實現圖形用戶界面的自主基礎Agent,可用於網頁瀏覽與安卓手機操作,與人類表現差距進一步縮小。認爲,智譜克服了當前Agent訓練的堵點,通過建立網頁瀏覽交互數據集,以及在強化學習、微調階段進行算法創新,實現了在大語言模型上操作系統級Agent突破。

GLM多端Agent家族,打造手機、PC、汽車等終端交互入口。GLM-Phone可實現跨APP操作、支持超長任務流程、支持更多主流APP,針對手機端應用提供了新的解決方案,顯著擴展了其在手機端的應用場景和操作能力;GLM-PC使得辦公領域將迎來生產力躍升,GLM-PC可實現會議替身、文檔處理、網頁搜索與總結、遠程和定時操作等;GLM-Car&More方面,Agent爲AI終極形態,加速萬物智能、萬物互聯,未來Agent有望滲透至各類智能設備,落地AI原生設備,實現設備主動服務用戶。

如果您有新聞線索,請聯繫我們:newsroom@caizhongshe.cn