☰

大模型迭代加速終端演進，有什麼新挑戰？

21世紀經濟報道記者駱軼琪深圳報道

雖然對於不少硬件來說，AI技術早在多年前已滲透到日常功能中，但真正有望帶來顛覆性改變還是AI大模型的到來和落地應用。

近日舉行的阿里雲深圳AI峰會上，阿里雲智能集團副總裁、公共雲首席解決方案架構師韓鴻源在演講中回顧分析，雲計算的發展伴隨新技術爆炸和新業務爆發而持續迭代，發展至今大概經歷了六個階段，人工智能泛在存在正成爲新趨勢。

這也意味着更多類型終端產品和應用將持續演進和迭代，應對模型落地挑戰。

北科瑞聲創始人、國家重大人才計劃特聘專家劉軼指出，電腦、手機、手錶等終端是離用戶最近的信息入口，大模型與終端的結合將加快AI技術普及。

“在大模型時代，第五代人機交互模式將取代第四代，也就是蘋果率先推出的觸控模式。後續將跟人之間交流一樣，用自然語言交互讓機器明白人的意圖。那麼就可能在設備端出現私有化的個人助理，甚至可以落地在汽車、平板甚至手錶、手環上。”他續稱，產業界也應協作推動大模型應用落地。

持續迭代

按照發展階段來看，韓鴻源指出，最開始，雲計算承載的是把線下的IT技術能力搬到雲上，目的是降低成本和方便管理能力提升，到今天爲止很多人對雲計算的認識依然停留在這一階段。

實際上經過初期管理能力和成本優化階段後，雲上誕生了雲原生這類新的開發範式，由此加速了應用和能力的迭代提升，也促進雲計算本身發展。

雲原生技術普及後，下一個階段誕生了很多先進架構需求，這來自於越來越多關鍵業務被承載在雲上後，提出了新需求。例如通過軟件定義的方式，做到高可靠性和高可用性。

此後便迎來全球化蓬勃發展，近些年來全球化過程中的雲計算，面臨如合規、數據主權等話題，此後通過很多工作解決掉了絕大部分擔心。由此也促成國內企業蓬勃地出海發展。

近兩年來，隨着生成式AI爆發，對基礎設施和基礎能力提出新需求。“預計隨着AI持續發展和成本持續降低，AI會無處不在，就進入了人工智能泛在的新發展階段，我們在鋪平需要的所有技術能力和手段準備。”他表示。

韓鴻源指出，生成式AI正對計算、數據、開發、部署等多個維度的技術能力提出新挑戰。例如計算能力從PFLOPS至EFLOPS計算量需求，且要持續運行一個訓練任務從數天至數月；數據量則是TB級至PB級的體量會常態化參與到計算過程中，才能產生想要的結果等。整體看，目前已有70%的組織在使用雲上託管的AI服務。

目前看到的新發展方向是模型即服務（MaaS）。他進一步分析道，傳統意義上會認爲雲計算是由基礎設施和軟件層技術來幫助實現。但隨着人工智能發展，今天需要把另一個因素引進到技術棧中，就是“模型即服務”能力。此前IaaS、PaaS是更偏傳統計算機架構下有效執行的能力，但到今天以模型和AI爲中心時，神經網絡會成爲計算能力一個基礎的組成部分，經網絡計算方式會跟以前傳統機器學習的方式有很大差異，結合新方式引入會帶來很多變化，如資源池、管理方式、技術能力等。由此，未來將是IaaS+PaaS+MaaS三個方向共同結合支撐業務系統和應用有效地運行和發展。

基於這些思考和觀察，通義模型系列也在持續迭代和完善生態。通義系列模型正式發佈始於2022年9月；2023年10月通義系列應用發佈，同時通義千問2.0發佈，彼時已經具備主流先進模型能力；此外也在着手開源貢獻，2024年4月，通義千億級模型開源；期間也在構建開放社區推動商業化應用。

落地挑戰

當然大模型的出現並持續迭代，也爲端側落地帶來新的變量和挑戰。

優必選科技副總裁、研究院副院長龐建新分享道，大模型的出現，對端側的多模感知、任務決策和規劃等提出新挑戰。例如多模態感知方面，將不止包括語音和環境感知，還需要結合知識和上下文；在場景落地方面，此前手動輸入了諸多條件，但隨着環境優化，大模型的能力落地需要一定程度重新規劃和執行。

OPPO AI技術戰略規劃總監陳曉春則表示，雖然AI技術已經存在了很長時間，但真正能感受到體驗切實改變還是從生成式AI開始。對此，OPPO的思考是，一開始探索全域個人助理，此後是落地到本地完成一定工作；再是本地APP如何與手機結合，解決用戶在手機端時間碎片化的問題。

對於手機端研發來說面臨的挑戰包括：一方面是時延，例如在海外手機漫遊場景下如何完成端側的實時翻譯能力；其二是高隱私，端側的意圖推理具備一定隱私屬性，那麼在端雲協同之間如何完善安全保障措施；其三是如何平衡功耗和成本，“模型在端側運行不需要那麼大，那麼遇到多種感知和大模型結合的情況下，很多小尺寸甚至傳統方案就要引用剛進來。”

劉軼分析道，AI在語音方面的發展對市場進行過兩次較爲重要的教育。第一次是Siri推出，在手錶、手機上具備語音交互能力，但當時受限於算法和算力條件，並未達到多數用戶的期望效果；第二次就是近期，GPT-4o的展示顯示出其已經可以像人一樣具備低延遲、快速理解能力。

但國內能夠把語音相關交互落地成產品，真正離線落地的終端很少，這是伴隨了諸多挑戰和壁壘。“比如我認爲7B規模的端側模式是極限，但可能會因爲用戶體驗問題，影響到落地在手機和平板上的產品完善；1B規模很多人在研究，但可能是面向特定行業和領域。那麼最終就要與傳統的處理方法，例如知識圖譜、增強搜索能力關聯。再真正達到可用的現實效果。”

諸多頭部終端廠商都在大模型領域與阿里雲深度合作，以期探索並提升產品智能化體驗。

龐建新指出，優必選通過與阿里雲開展大模型相關合作，希望解決如何用開源大模型，根據場景做調參技術優化、端側部署和雲端部署協同等問題。“我們相信，端雲結合是短期必須落實的問題，這對知識和內容有很大依賴度，中間如何調度需要廠商自己解決，根據形態和場景任務來推進。”

OPPO也一直與通義系列模型在展開合作。“在多模態大模型加持下，人機交互側將出現很大變革。更多服務和知識節點需要依賴雲側模型，那麼就要跑在距離用戶很近、算力較大的地方。算子、模型技術本身等方面，我們的研發項目都在緊密開展合作。”陳曉春分析道。

此外，vivo基於阿里雲訓練自研藍心大模型，千卡大模型預訓練性能接近LLaMA水平。目前，vivo藍心大模型已對vivo手機的AI影像、智能助理、圖文創作等場景進行了全面優化，並升級了視覺輔助產品“vivo看見”。

小鵬汽車也宣佈，已在智能座艙場景中新增接入阿里雲通義千問。在發佈量產上車的端到端大模型後，小鵬成爲同時將大模型落地座艙和智駕的車企。

對於產業界如何協作推動大模型應用落地，劉軼還指出，一方面要借鑑Open AI的分享和衆籌機制，例如在應用中，阿里雲提供通義系列底座，就需要結合千行百業，共同建設面向行業、好用的大模型；另一方面是如何做好端雲協同，“語音交互在低算力條件下只能做到本地信號處理或壓縮編碼，更多要在雲端處理，如何做好連接很重要，Rabbit R1就是在做一種嘗試。”

大模型迭代加速終端演進，有什麼新挑戰？

相關資訊