☰

阿里雲發佈通義千問2.5，性能全面趕超GPT-4 Turbo

5月9日消息，阿里雲正式發佈通義千問2.5，模型性能全面趕超GPT-4 Turbo。同時，通義千問最新開源的1100億參數模型在多個基準測評收穫最佳成績，超越Meta的Llama-3-70B，成爲開源領域最強大模型。

據瞭解，相比通義千問2.1版本，通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。在權威基準OpenCompass上，通義千問2.5得分追平GPT-4 Turbo，是該基準首次錄得國產大模型取得如此成績。

與此同時，通義還發布了最新款開源模型，1100億參數的Qwen1.5-110B，該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型；在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B衝上榜首。

據瞭解，通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越Gemini Ultra和GPT-4V，目前已在多家企業落地應用；通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手。

“開發者的反饋和開源社區的生態支持，是通義大模型技術進步的重要助力。”阿里雲CTO周靖人透露，未來通義大模型還會持續開源。根據最新數據，通義通過阿里雲服務企業超過9萬、通過釘釘服務企業超過220萬，現已落地PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

阿里雲發佈通義千問2.5，性能全面趕超GPT-4 Turbo

相關資訊