騰訊公佈智能體、長文模型等產品進展 大模型應用百花齊放又狹路相逢

5月17日,騰訊雲生成式AI產業應用峰會在北京召開,公佈騰訊大模型應用產品的系列進展。

這些進展包括:發佈具備處理超過38萬字符超長文本能力的長文模型,上線一站式AI智能體創作與分發平臺“騰訊元器”,發佈三大引擎工具,預告了C端助手App騰訊元寶的發佈時間。

《每日經濟新聞》記者注意到,長文模型、個人助手、智能體平臺這都是近期大模型廠商們的競爭焦點。一旦有應用在市場激起“水花”,就會漾起同行的波瀾,推動其他廠商開始跟進研究。這樣的氛圍,讓大模型應用似乎遭遇了彼此“狹路相逢”的場景。

騰訊集團高級執行副總裁、雲與智慧產業事業羣CEO湯道生表示:“今天,大家對於大模型的訴求更加務實,不僅關注模型技術的領先性,也要看怎麼融合到業務場景,怎麼降本增效解決實際問題。”

騰訊公佈多項大模型進展

這個5月,全球大模型圈好不熱鬧。OpenAI推出了全能模型GPT-4o,展示了毫秒級反應和多模態交互的新能力。隨後,谷歌在其I/O開發者大會上展示了AI助手Astra和旗艦大模型Gemini。

在國內,阿里雲於5月9日正式發佈通義千問2.5,5月15日字節跳動發佈豆包大模型並挑起了“價格戰”。更早的4月15日,百度推出了AgentBuilder、AppBuilder、ModelBuilder三大開發工具。

給激戰的5月再添一把“火”的是騰訊。在5月17日舉辦的騰訊雲生成式AI產業應用峰會上,騰訊公佈其大模型的多項新進展:基於混元大模型的一站式AI智能體創作與分發平臺——“騰訊元器”首次亮相,企業和開發者可以基於騰訊元器直接創建智能體,使用騰訊官方的插件和知識庫,還能將這些智能體一鍵分發到QQ、微信客服、騰訊雲等渠道上。峰會上還預告了基於混元大模型打造的C端助手App“騰訊元寶”將於5月30日發佈。

同時,多個版本的模型——hunyuan-pro、hunyuan-standard、hunyuan-lite,通過騰訊雲對外開放,滿足企業客戶、開發者在不同場景下的模型需求,落地最優性價比模型方案。其中hunyuan-standard模型具備256k的超長上下文理解能力,單次處理字符數超過38萬個。

騰訊雲也專門推出了三款PaaS(平臺即服務)產品——大模型知識引擎、圖像創作引擎和視頻創作引擎,打造大模型原生工具鏈,助力企業在知識服務、圖像和視頻創作上提質提效。

騰訊大模型的新進展都響應了近期的行業熱點。可以說,廠商們在對大模型應用“爆點”的識別上,眼光頗爲一致。

例如,“騰訊元器”所瞄準的智能體,通過模仿人的決策過程,可以個性化定製,讓使用者擁有一個24小時待命的全能助手。OpenAI在今年1月就推出GPTs(定製版的ChatGPT)和GPT商店,用戶無須編碼就可創建自己的GPT,從而構建智能體平臺生態。百度則在今年4月份上線了文心智能體平臺AgentBuilder,支持零代碼、低代碼兩種模式,商家用幾句話就能生成智能體。

另一方面,在長文模型上,典型的代表就是月之暗面的Kimi;在AI個人助手方面,OpenAI的GPT-4o、谷歌的Astra都是先行者。

大模型應用爆發已至?

隨着各大廠商加速推出大模型的細分應用,不少機構判斷,今年大模型應用將會爆發。

海通國際研報指出,2024年有望成爲國產大模型全面商業落地的元年,先進的大模型能力也將逐漸轉化爲落地實際場景的產品應用,從而帶動大模型在金融、教育、法律、醫療等衆多垂直行業的持續落地,AI2B與AI2C的需求天花板也有望全面打開,在這個過程中,AI的投資也從映射和跟隨,變爲引領。

談到大模型的落地應用,騰訊集團高級執行副總裁、雲與智慧產業事業羣CEO湯道生在會上表示:“今天,大家對於大模型的訴求更加務實,不僅關注模型技術的領先性,也要看怎麼融合到業務場景,怎麼降本增效解決實際問題。此外,我們也注意到產業對模型的需求在不斷變化。一方面,隨着產業信息的載體多元化,使用者對模型的需求不僅僅是處理單純的文字,還需要它處理圖片、視頻等多種信息。大模型的能力競爭,正在從單一的文生文,拓展到文生圖、文生視頻、圖生圖、圖生視頻等多模態能力。”

與此同時,面對廠商之間的激烈角逐,騰訊高管們在會後的採訪中也免不了被問到與同行的比較。面對行業價格戰,騰訊雲副總裁、騰訊雲智能負責人吳運聲就表示,相比於價格,騰訊更關注當下大模型給客戶帶來的價值。

再例如,OpenAI日前發佈的AI助手GPT-4o邁向了更自然的人機交互,橫跨語音、文本和視覺,實現超低時延的交互和感知人類情緒。對此,國內廠商如何追趕?吳運聲在接受《每日經濟新聞》記者提問時表示:“GPT-4o是一種將視覺、音頻和文本三種模態融合到一個空間裡做訓練推理,做端到端輸出的技術進展。我們會關注這樣的發展,這些技術突破可能會帶來商業化的跨越式增長。”

此外,吳運聲也提到,多模態相互融合、實現端到端的應用,其中的難點是三種模態的特徵形態存在差異。“如何將文本的序列化、視覺圖像的二維性、音頻的信號變化,都影射到同一個空間裡,再去描述他們的特徵,這需要算法和技術上的研究和突破。”他表示。

吳運聲最後談到,目前在產業端,大模型的落地還面臨一些挑戰:例如企業對大模型能力預期過高、操之過急,因此在企業需求和大模型能力匹配,以及推進節奏上的協調,都需要磨合;再例如,要降低大模型的使用門檻,減少對技術人才及專業技術的能力依賴,讓一線生產、經營人員也能“零門檻”用上大模型,才能加速生產經驗與模型技術的融合;還有,要提高平臺適配性,大模型工具既要能匹配、適應不斷迭代的大模型技術,也需要滿足不斷擴大的場景需求,滿足可持續的投入產出比;最後還要保障安全合規,只有保障生成結果的安全、準確,才能滿足企業對穩定性的需求,讓企業管理者放心加大投入建設。