☰

通義千問開源千億級參數模型

4月28日消息，通義千問開源1100億參數模型Qwen1.5-110B，成爲全系列首個千億級參數開源模型。通義千問1100億參數模型延續了Qwen1.5系列的Transformer解碼器架構，採用了分組查詢注意力方法（GQA），使得模型在推理時更加高效。110B模型支持32K上下文長度，具備優秀的多語言能力，支持中、英、法、德、西、俄、日、韓、越、阿拉伯等多種語言。

相關資訊

▣ 通義千問發佈首個千億級參數開源模型
▣ 通義千問開源320億參數模型
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
▣ 阿里通義千問開源首個MoE模型
▣ 通義千問開源視覺語言模型Qwen2-VL
▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
▣ 通義千問開源模型下載量突破2000萬
▣ 通義千問開源Qwen2.5開源模型，累計下載量突破4000萬
▣ 阿里通義千問Qwen2大模型發佈並同步開源
▣ 通義千問開源Qwen2.5
▣ 夸克發佈自研千億級參數大模型
▣ 阿里通義千問代碼模型Qwen2.5-Coder全系列正式開源
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ 阿里雲通義千問開源
▣ 微軟開源爆火1bit大模型推理框架！千億參數模型量化後單CPU可跑
▣ 通義千問升級旗艦模型Qwen-Max，性能接近GPT-4o
▣ 阿里雲CTO周靖人：通義千問開源模型下載量突破2000萬次
▣ 百川智能發佈千億級參數的大語言模型Baichuan3
▣ 通義千問模型降價風暴，最高降幅達85%！
▣ 英偉達開源3400億參數模型Nemotron-4 340B
▣ 數智早參｜蘋果推出開源大模型OpenELM；阿里雲宣佈EMO模型上線通義APP
▣ 通義千問視覺理解模型全線降價超80%；聞泰科技擬出售ODM業務｜數智早參
繼百度之後阿里雲AI大模型「通義千問」向大衆開放
▣ 2024最後一天通義千問開啓年內第三輪大模型降價
▣ 1760 億參數、大小 281GB，Mixtral 8x22B 開源模型登場
▣ 阿里雲推AI大模型通義千問夥伴計劃啓動
▣ 通義千問三款主力模型再降價最高降幅85%

DMCA | PRIVACY | s@bg3.co