清華大學孫茂松:企業不要“重複造輪子”,要做專用領域的大模型

11月28日消息,近日,在2023大模型產業前沿論壇上,中關村科金正式發佈了國內首個企業知識大模型、AgentGraph應用開發平臺,以及“超級員工”助手系列AIGC應用。

清華大學人工智能研究院常務副院長、歐洲科學院外籍院士孫茂松表示,大模型在知識領域的應用,從學術界來看還是有很大的發展空間。未來大模型的趨勢將有以下幾個重要方面:一是走向具身智能,即用語言大模型控制機器人,向機器人發出指令,未來兩三年這一領域可能會有大發展。二是全民化的人工智能,大模型在圖像生成、文本生成方面能力都很強。三是機器人客戶,例如無人駕駛汽車可以自動去充電、加油並完成相應的消費,有機構預測,到2026年全球將有近150億臺聯網產品具備成爲客戶的潛力。

會後,孫茂松教授以及中關村科金技術副總裁張傑博士接受媒體採訪時談到,現在是通用人工智能難得發展的好時機,但是人工智能在垂直領域的應用落地,卻還有許多疑難問題等待解決。

孫茂松向本站科技等媒體表示,在通用大模型基礎上再去訓練某一領域的專屬大模型,第一需要儘量多的收集該領域權威數據;第二需要分析該領域數據特點,然後針對性的構建領域大模型,比如金融領域表格特別多,大模型對於表格理解不太擅長,就需要設計和改進針對表格的處理,強化大模型這些方面的數字處理能力,這部分其實還是不容易的,但是必須要去做,有很多改進的空間。

在大模型熱潮席捲下,中國已經出現了“百模大戰”盛況。在孫茂松看來,“百模大戰”現象的出現是正常的。這一現象的出現說明,中國這些年人工智能的研究和技術發展不錯。“我們國家在人工智能方面的科技研究處於跟跑狀態,而有100家能跟上,說明技術基礎不錯,應用做的不錯,我們國家過去十幾年來人工智能的發展,總體來說也不錯。”

談到企業如何落地的問題,孫茂松強調,企業不要“重複造輪子”。“重複造輪子指得是通用基礎大模型,對於企業來說成本高企,沒必要投入有限的資源和精力放到構建一個基礎大模型上,對於企業而言機會在你自己專屬的領域裡面做事情,去做專用的領域大模型。”

中關村科金技術副總裁張傑博士則建議,企業應用大模型的時候不一定同一場景下用一個大模型,也不一定用千億級別規模參數非常大的模型,具體場景可能幾十億參數模型就可以把場景問題解決到極致。比如財富管理領域,只需要50億參數的大模型就能很好的用於營銷、客服等場景,那就沒必要做成千億參數,避免用大炮打蚊子,節省算力消耗的資源。“未來根據場景微調大模型可能會是一個企業裡高頻的需求。”(一橙)