☰

呂本富：端側模型，AI創新的新賽道

本文轉自：環球時報

隨着人工智能（AI）技術的快速發展，大模型的競爭正在從技術驅動過渡到市場驅動。在這一背景下，2024年以來，全球主流大模型間的比拼有兩個要點。一是重要產品發佈，OpenAI等企業的重大發布吸引全球目光；二是關注大規模產業應用和成本控制。

成本是商業考量的第一要義，OpenAI目前已經4次降價，國內頭部互聯網企業的主力模型也不得不大幅降價或將全面免費。數字經濟的發展經歷表明，平臺型通用技術一旦形成，市場會快速進入“馬太效應”，形成一家獨大或幾家壟斷的局面。當然AI+對人類社會的塑造，絕不僅僅生成式大語言模型這一個賽道。

5月22日，在歐洲最大的科技盛會“歐洲科技創新展覽會”（Viva Technology）上，來自中國的百度和榮耀分別闡述了大模型的新賽道——“超級應用和端側模型”，引起了大會的關注。其中，榮耀CEO趙明認爲，基於手機端的AI模型能承載生活娛樂、工作、學習等多個場景，具備在知識問答、文字擴寫、表格生成、編寫代碼、圖像處理，實現圖像填充、實時語音翻譯、智能助手、面部識別解鎖等多項功能。手機使用頻率最高，使用時間最長，因此在AI的落地競賽中，將處於最有利的位置。

大模型的參數規模正在快速增長，約每18個月時間會增長40倍。現在生成式大模型的計算和推理都在雲端進行，大模型參數和使用量的成倍增長帶來巨大計算推理壓力，當數十億用戶都日常使用生成式AI時，雲端模式顯然難以支持生成式AI的規模化擴展。過大參數也造成了在開發及使用過程中的成本高企，在一定程度上限制了AI應用的拓展和變現。因此，需要針對應用場景的小參數模型。

相比之下，端側模型通常不需要依賴雲端服務器的計算資源，可以減少雲端計算的成本，並且在沒有網絡連接的情況下也能工作。隨着生成式AI模型使用量和複雜性的不斷增長，僅在雲端進行推理並不經濟。將一些處理從雲端轉移到邊緣終端，可減輕雲基礎設施的壓力並減少推理服務成本。推動一部分算力下沉到端側，尤其是與用戶規模龐大的移動端設備結合，正是端側模型的努力方向。據統計，我國存量手機算力是數據中心算力的12倍，但算力利用率不足15%；全國寬帶用戶規模達5.9億，卻有80%帶寬資源處於閒置狀態。發展端側AI將極大地體現AI應用的中國特色。

除了成本以外，發展端側模型還有兩個因素。一是當前企業或個人用戶的AI應用場景都在端側，聊天記錄、辦公記錄、視頻和照片等數據也在端側。只有使用端側模型，才能打消用戶使用AI的疑慮。二是很多工業場景和野外場景，與雲端鏈接網絡不穩定，甚至存在斷線的情況，AI模型可靠性和穩定性就難以保障，必須有獨立運行能力的端側模型才能保障。

一旦大模型的競爭進入到端側領域就面臨幾個需要：完成底層芯片到上層操作系統及應用開發的軟硬一體深度適配；能夠在較低的功耗下運行且適合電池供電的移動設備；有電子圍欄技術感知周圍的場景。端側模型也需要鏈接智能音箱、安全監控、自動化家居控制系統等，提供更個性化和安全的服務。

對於很多中國企業來說，上述競爭就相當於進入主場。部分手機廠商，電池的超長待機、電子圍欄的場景感知的專長技術，從魔法大模型巧妙融入手機硬件，到系統級AI手機操作系統的崛起，具備了對大模型進行量化、剪枝、蒸餾，輕量化、小型化的技術。中國廠商的端側模型通常注重與國內市場的需求和特點相適應，正華麗變身爲世界手機端側AI創新的先鋒。（作者是中國國家創新與發展戰略研究會副會長）

呂本富：端側模型，AI創新的新賽道

相關資訊