實測騰訊首個大模型App:秒讀60萬字財報,精準讀圖識貓,信息搜索有待提升

智東西(公衆號:zhidxcom)作者香草編輯李水青

智東西5月30日報道,騰訊混元大模型首個App“騰訊元寶”今天正式上線。

騰訊元寶定位於全能AI助手,針對效率場景的信息獲取、處理和生產三大核心需求進行了優化;面向日常生活場景,元寶提供了圖像生成、生活幫手、UGC創作等特色AI應用,並新增了創建個人智能體等功能。

▲騰訊元寶App上線應用商城

據介紹,此次產品能力升級,背後來源於騰訊混元底層模型的持續迭代。騰訊混元大模型於去年9月發佈,到目前整體性能提升超50%,包括參數規模從千億升級至萬億、預訓練語料從萬億升級至7萬億tokens、架構升級爲混合專家MoE等。

發佈會後,智東西等少數媒體與騰訊雲副總裁、騰訊混元大模型負責人劉煜宏進行了深入交談。

目前市面上已經有不少同類大模型App,元寶的差異化優勢是什麼?

劉煜宏稱,騰訊的優勢主要在於三個方面:一是產品工程能力較強,在工程方面能夠壓縮成本;二是騰訊的產品體系是最全的,對各個應用領域的適配度更強;三是混元大模型本身的性能優勢,騰訊從去年就開始在文生圖方面採用DiT架構,也很早就開始採用MoE架構,技術演進很快。

談到與其他AI產品是否存在同質化現象,劉煜宏稱,騰訊做大模型最初是爲了滿足公司內部業務需求,在這個過程中發現很多用戶、企業也有這方面的需求,所以開放給大家使用。在產品化上,騰訊最優先考慮的是用戶需求,用戶是否需要這個產品、需要哪些功能,而不是去對標競品。

在商業模式方面,劉煜宏稱元寶App目前暫時沒有在C端收費的計劃。

作爲騰訊推出的首款混元大模型原生應用,騰訊元寶表現如何?智東西第一時間上手體驗了元寶App,發現其雖然與市面上已有的大模型App有一些重合的功能,但在生成速度、內容優質程度上,表現出一定的優勢。

一、萬億參數、上下文窗口256k,面向三大核心需求定向優化

劉煜宏首先談道,現階段AI應用雖然層出不窮,但整體AI產品滲透率仍然很低。頭部AI產品日活躍用戶規模約爲百萬,按互聯網用戶規模12.32億來看,在整個互聯網滲透率不到1%。

▲AI產品滲透率低,行業處於起步階段

在騰訊看來,滲透率低主要是因爲大模型仍在發展期,產品解決方案不夠成熟,應用場景有限;其次,用戶層面的認知仍在建立,據騰訊調查,目前對AI的需求主要集中在搜索、效率場景,有約45%的人將其當作搜索引擎來用。

▲大模型應用滲透率低的原因

騰訊於去年9月發佈了混元大模型並推出小程序版,當時的模型爲千億參數規模,預訓練語料萬億tokens,4k上下文窗口。

經過不到一年的迭代,目前混元大模型效果整體提升50%,達到萬億參數,預訓練預料7萬億tokens,上下文窗口擴展到256k。

目前,騰訊內部已有600+業務接入混元大模型。劉煜宏透露,混元每天調用量超2億,公司內部有23%左右的代碼都由AI生成。

基於用戶洞察,騰訊認爲大模型原生AI產品需要滿足兩大需求。一是貼近用戶場景,包括職場辦公、學習充電、休閒娛樂等;二是滿足高頻需求,如搜索問答、效率提升、創意生成。

針對這些需求,騰訊推出全能AI助手騰訊元寶App,面向效率場景的三大核心需求——信息獲取、處理和生產,進行定向優化。

▲工作效率場景核心需求

據介紹,在AI搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,並通過AI搜索增強,提升時新類和知識類問題效果;同時,內容覆蓋微信公衆號等騰訊生態內容及互聯網權威信源,答案准確性更高;此外,元寶還會提供所引用的參考資料,並給出相關推薦,方便快速溯源及延伸閱讀。

在AI總結方面,元寶可上傳最多10個PDF、word、txt等多種格式文檔,並能夠一次性解析多個微信公衆號鏈接、網址,支持256k原生窗口上下文,相當於一本《三國演義》或是英文原版《哈利波特》全集。

在AI寫作方面,元寶支持多輪問答,能夠將對話的內容整理成報告,按照要求進行結構化輸出。

此外在日常生活場景,騰訊元寶也能有問必答,提供圖像生成、內容創作、學習助手、生活幫手、UGC創作等多種AI應用。劉煜宏稱,在騰訊看來,大模型AI產品的用戶價值終點是“服務於每個普通人的生活”。

元寶網頁端、小程序端也同步上線,同時將聯合騰訊系業務、合作伙伴、騰訊元器創作者等,共創AI應用生態。

二、AI搜索一鍵總結實時熱點,AI總結精準提煉英文財報

打開騰訊元寶App,主頁面是一個對話框,頂部有兩個小模塊,分別顯示日期、天氣、實時資訊以及隨機問題建議;下方提供了在AI搜索、文檔總結、網頁總結、AI作圖等能力方面的隨機提問建議。

▲騰訊元寶首頁

提問入口設計比較簡潔,同時豐富的提問建議也降低了普通用戶首次使用的門檻。

點擊頂部的“元寶”按鍵,會出現開始新對話、刪除聊天記錄的選項,此外還可以切換語音音色,目前有20多種音色可供選擇,還提供了創建自己聲音的功能。

▲音色選擇界面

據劉煜宏介紹,元寶在工作場景目前主要的優化方向是AI搜索、AI總結、AI寫作。

我首先試了一下在AI搜索場景下系統推薦的問題:“10元咖啡阿姨”是什麼梗?

元寶很快給出了回答,從起源、背景信息、社會反響、社會意義等方面介紹了這個事情的發生經過和後續影響,並推薦了更多內容和可以進一步追問的選擇。

▲AI搜索實時訊息

當我追問:阿姨的咖啡店在哪裡可以找到?元寶準確地答出店鋪地址,並補充了營業時間和相關注意事項。

▲AI搜索下的追問

除了瞭解當下的熱點信息之外,我也想了解未來的趨勢或可能發生的事。我問道:蘋果下個月的WWDC可能會發什麼?

元寶首先告訴了我WWDC的具體時間,隨後按新產品、新功能、其他亮點等類別進行了歸納整理。

▲AI搜索

不過這個回答中存在部分不夠準確的信息,如將Vision Pro劃分爲“新產品”等。點開這句回答的參考資料鏈接,可以看到是一篇去年6月Vision Pro發佈的新聞稿。

在平日的搜索中,對圖片的識別和提問也是很常見的需求。我上傳了一張小貓實拍圖,問元寶這是什麼品種的貓。

元寶首先答出這是英國短毛貓,但我想進一步瞭解是英短裡的什麼品種,追問後,元寶準確地將範圍縮小到銀漸層或藍金漸層。

▲圖像識別

在AI總結能力上,元寶支持256k上下文窗口。我首先上傳了一篇Llama的論文,讓元寶替我解讀。

元寶從引言、方法、主要結果等方面提煉了論文的主要信息,最後總結了該論文的主要貢獻。

▲論文解讀

英文財報的信息提取也是日常工作中的高頻場景。我上傳了一個187頁的英偉達年度財報文件,元寶進行文件解析後,顯示有64.2萬字。

隨後我要求元寶總結主要內容,它從財務表現、市場地位、業務戰略等角度進行了總結。

▲英文財報解讀

在財務表現部分,元寶提到了英偉達在2024財年取得的營收、淨利潤數據。平時在使用AI提煉這類內容時,有時會遇到數據不準確的問題,我還是打開財報文件自己覈實了一下。值得慶幸的是,元寶提供的數據十分準確。

▲英偉達2024年度財報

隨後我又上傳了《三體》全集電子書,元寶解析後顯示字數達到92.9萬。我問道:雲天明講了什麼樣的童話?

元寶稱,基於文檔內容,雲天明講的童話故事是《國王的新畫師》、《饕餮海》和《深水王子》。

故事的名字是準確的,不過我真正想問的是故事內容,於是追加道:總結這三個故事。

這次元寶的回答有些偏差,一方面沒能完整地概括故事內容,另一方面出現了不停重複一句話的情況。

▲長文本

看來,90多萬字的長度還是有些超出元寶的能力範圍了。

發佈會上提到,元寶可以一次性解析多個微信公衆號鏈接。於是我輸入了兩個智東西公衆號的文章鏈接,讓元寶總結主要內容。

元寶精準提煉了文章內容,並在最後總結了兩篇文章的共同點。

▲微信公衆號文章提煉

最後再來試一下AI寫作功能,我讓元寶幫我寫一份宣傳智能汽車產業峰會的小紅書文案。

元寶對小紅書平臺的風格拿捏得不錯,用了豐富的表情符號,文章結構也比較合理,最後還補充了相關Tag。

▲宣傳文案撰寫

六一兒童節馬上就要到了,我讓元寶幫我策劃一場適合小學的親子活動。

元寶給出的策劃方案十分詳細,包括每個環節的時間內容,在內容上策劃了運動會、手工製作、表演等形式,並貼心地提供了活動準備、注意事項相關的建議。

▲活動策劃

體驗下來,我的感受是元寶的生成速度比較快,搜索、總結內容方面雖然出現了一些小失誤,但瑕不掩瑜,整體準確度還是比較高的。此外在標註出的參考資料上,能看到有不少出自微信公衆號文章,這樣的信息來源爲元寶提供了內容上的差異化競爭力。

三、智能體打造多模態創意應用,化身種草達人、旅行規劃師

除了對話式AI,元寶還提供了多種智能體功能,主要分爲工作、生活兩大類,包括翻譯、PPT、文案撰寫、營銷專家等效率類工具,以及創意貼紙、創意繪畫、AI頭像等娛樂向工具。

根據系統推薦,我首先體驗了“創意貼貼貼”功能,它能根據文字輸入或圖像輸入創建不同風格的貼紙。

我上傳了一張貓咪全身照,元寶很快生成了4張對應的貼紙圖像。雖然看花色似乎有些差異,不過整體神態、動作、顏色都比較符合。

▲創意貼紙

在創意繪畫智能體中,元寶可以根據簡單的文字描述生成對應圖像,實際體驗下來生成時長大概在5秒。點開生成的圖像可以看到,元寶自動擴展了提示詞,增加了更多細節、景別描述等。

▲AI生圖

旅行達人智能體可以幫助制定旅行計劃,我提問道:去澳門玩兩天,有什麼建議?

元寶爲我列出了一個時間表,並提供了交通方式、住宿選擇、價格參考等。

▲旅行規劃

我還體驗了種草文案寫手智能體,根據提示,只需輸入商品名稱就可以生成宣傳文案。我輸入了樟腦丸,看看這個東西要怎麼去安利。

元寶首先給它定位爲“超級實用的小物件”,隨後從產品特點、使用感受、實際效果、使用方法來進行種草,最後給出了使用注意事項。

▲種草文案

整體來看,元寶在智能體能力上表現也不錯,作爲工作、生活幫手能提供有價值的信息。雖然目前官方提供的智能體選擇還不是特別豐富,不過與騰訊元器打通後,應該會呈現出更多有趣的功能選擇。

結語:大模型App賽道,又一強力選手入場

隨着騰訊元寶的正式上線,大模型App賽道再次迎來一位強有力的選手。現階段,元寶雖然在功能創新、實時信息搜索準確度上仍有提升空間,不過在生成速度、內容質量上也有一定優勢。

作爲業務廣泛的互聯網大廠,騰訊在產品工程能力、技術創新上都有很大的積累。我們期待元寶在未來的迭代中呈現出更豐富的功能和更高的水準,也期待它的加入能爲大模型App賽道帶來良性競爭。