高通與騰訊混元合作,基於驍龍8至尊版共同推動騰訊混元大模型終端側部署

北京時間2024年10月21日,高通技術公司宣佈與騰訊混元合作,基於驍龍8至尊版移動平臺,共同推動了騰訊混元大模型7B和3B版本的終端側部署,展示了此合作實現出色的運行表現。這將有助於騰訊混元大模型爲廣泛的業務場景提供技術支持,通過利用終端側AI加速產品創新,有效降低運營成本,並進一步擴展生成式AI在終端側的應用和普及。

驍龍8至尊版移動平臺搭載全新的第二代定製高通Oryon CPU和增強的高通Hexagon NPU,充分利用高通AI引擎優勢,能夠帶來更強大的終端側生成式AI處理能力。驍龍8至尊版的強大AI算力,結合高通AI軟件棧以及行業領先的工具套件,包括高通AI模型增效工具包(AIMET)等,爲模型提供了全棧優化能力。通過使用基於硬件的INT4量化技術,可以大幅提升騰訊混元大模型在終端側的運行效率,端側推理實現首個token生成時延達到150ms,解碼速率達到超過30 tokens/秒。

騰訊混元大模型已爲騰訊內部超過700個業務場景和C端應用提供底層技術支持,包括微信輸入法、騰訊手機管家、QQ、騰訊視頻、QQ瀏覽器、企業微信、騰訊會議等,通過實現面向驍龍8至尊版的終端側部署,能夠利用終端側生成式AI的豐富優勢,更好地滿足廣泛的終端側業務需求。例如,騰訊手機管家短信智能識別功能率先利用騰訊混元的終端側模型能力,通過海量數據結合深度神經網絡與預訓練,讓模型具備極強的語義理解能力,通過結合上下文語境信息更準確地理解短信意圖,使短信召回率大幅提高將近200%,識別準確率提升20%。由於部分短信涉及用戶個人敏感信息,端側AI還可以在保證出色性能表現的同時,有效保護用戶的個人信息隱私安全。