阿里雲發佈通義千問2.5 全面趕超GPT-4 Turbo

快科技5月9日消息,阿里雲正式發佈了通義千問2.5,模型性能全面趕超GPT-4 Turbo,聲稱地表最強中文大模型。

據瞭解,通義千問2.5最新開源的1100億參數模型在多個基準測評中均取得了最佳成績,成功超越了Meta的Llama-3-70B模型,成爲開源領域的新標杆。

相比通義千問2.1版本,通義千問2.5在上述四項能力上分別提升了9%、16%、19%和10%,其中中文能力更是持續領先業界。

在權威基準OpenCompass上,通義千問2.5的得分追平了GPT-4 Turbo,這是該基準首次有國產大模型取得如此出色的成績。這一成績不僅證明了通義千問2.5在中文語境下的卓越性能,也展示了阿里雲在人工智能領域的創新能力。

除了通義千問2.5外,阿里雲還發布了最新款開源模型Qwen1.5-110B。這款擁有1100億參數的模型在MMLU、TheoremQA、GPQA等基準測評中均超越了Meta的Llama-3-70B模型,並在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上榮登榜首,進一步鞏固了通義開源系列在業界的領先地位。

通義的多模態模型和專有能力模型也展現出了業界頂尖的影響力。其中,通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越了Gemini Ultra和GPT-4V,目前已在多家企業落地應用,爲各行各業帶來了實質性的幫助。

此外,通義千問代碼大模型CodeQwen1.5-7B也是值得一提的亮點。這款模型在HuggingFace代碼模型榜單Big Code上位居前列,同時還是國內用戶規模第一的智能編碼助手通義靈碼的底座。