阿里雲發佈通義千問2.5,性能全面趕超GPT-4 Turbo

5月9日消息,阿里雲正式發佈通義千問2.5,模型性能全面趕超GPT-4 Turbo。同時,通義千問最新開源的1100億參數模型在多個基準測評收穫最佳成績,超越Meta的Llama-3-70B,成爲開源領域最強大模型。

據瞭解,相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。在權威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo,是該基準首次錄得國產大模型取得如此成績。

與此同時,通義還發布了最新款開源模型,1100億參數的Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B衝上榜首。

據瞭解,通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越Gemini Ultra和GPT-4V,目前已在多家企業落地應用;通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手。

“開發者的反饋和開源社區的生態支持,是通義大模型技術進步的重要助力。”阿里雲CTO周靖人透露,未來通義大模型還會持續開源。根據最新數據,通義通過阿里雲服務企業超過9萬、通過釘釘服務企業超過220萬,現已落地PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。