性能超越GPT-4Turbo 通義千問2.5問世

阿里雲日前正式發表「通義千問2.5版」,聲稱模型效能將全面趕超GPT-4-Turbo,成爲「地表最強」中文大模型。(中新社)

大陸阿里巴巴旗下阿里雲通義家族再添新成員!阿里雲日前正式發表「通義千問2.5版」,同時開源通義千問1100億參數模型,聲稱模型效能將全面趕超GPT-4-Turbo,成爲「地表最強」中文大模型。通義千問APP也宣佈更名爲「通義APP」,致力於成爲通情達義的人工智慧(AI)助手。

綜合陸媒報導,阿里雲日前舉行高峰會,公佈最新數據顯示,通義大模型透過阿里雲服務企業已超過9萬家、透過釘釘服務企業超過220萬家,且截至目前通義開源模型累計下載量突破700萬。這也顯示通義落實應用,現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

阿里雲指出,相比「通義千問2.1」版本,「通義千問2.5」的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。其中,在權威基準OpenCompass上,「通義千問2.5」的得分追平GPT-4 Turbo,是該基準首次錄得大陸國產大模型取得該成績。

「模型效能全面追趕GPT-4 Turbo,在中文大模型方面領先業界」,阿里雲同時強調,通義千問最新開源的1100億參數模型在多個基準評估中收穫最高得分,超越Meta的Llama-3-70B,成爲開源領域中表現最佳的模型之一。小米旗下AI助理「小愛同學」也已與通義大模型達成合作。

阿里雲CTO周靖人介紹,當下企業應用大模型有3種模式,一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發應用,其中最典型的需求是RAG,以企業數據對大模型進行知識增強。他強調,開發者的回饋與開源社羣的生態支持,是通義大模式技術進步的重要助力。

公開資料顯示,通義大模型2023年4月問世以來,目前發展出文生圖、智慧編碼、文件解析、音視頻理解等能力。企業客戶和開發者可以透過API呼叫、模型下載等方式接入;個人用戶可從通義APP、官網和小程式免費使用通義家族全端服務。