通義千問發佈首個千億級參數開源模型
觀點網訊:4月28日,通義千問宣佈推出1100億參數模型Qwen1.5-110B,標誌着其成爲全系列中首個達到千億級參數的開源模型。該模型繼續沿用了Qwen1.5系列的Transformer解碼器架構,並採納了分組查詢注意力方法,顯著提高了模型在推理過程中的效率。
此110B模型的一大亮點在於其能夠支持長達32K的上下文長度,並且擁有卓越的多語言處理能力。它能夠兼容包括中文、英語、法語、德語、西班牙語、俄語、日語、韓語、越南語以及阿拉伯語在內的多種語言,這一特性使其在全球化的應用場景中具有顯著優勢。
相關資訊
- ▣ 通義千問開源千億級參數模型
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 通義千問開源320億參數模型
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 百川智能發佈千億級參數的大語言模型Baichuan3
- AI飛速發展 陸10億級參數規模以上大模型已發佈79個
- ▣ vivo發佈自研藍心大模型:5款大模型 覆蓋十億、百億、千億三個量級
- ▣ 「天工大模型3.0」4月17日正式發佈——同步開源4000億參數MoE超級模型,性能超Grok1.0
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- ▣ 阿里雲發佈通義千問2.5
- ▣ 國內首個官方大模型評測結果出爐 阿里雲通義千問首批通過評測
- ▣ 大模型加速“上手機” 聯發科與阿里通義千問實現芯片級適配
- ▣ 剛剛,全球最強開源大模型 Llama 3 發佈:使用 15T 數據預訓練,最大模型參數將超 4000 億
- 參展MWC 華爲發佈通信行業首個AI大模型
- ▣ 1760 億參數、大小 281GB,Mixtral 8x22B 開源模型登場
- ▣ 聯發科攜手阿里雲 完成通義千問大模型端側部署
- 繼百度之後 阿里雲AI大模型「通義千問」向大衆開放
- ▣ 阿里雲推AI大模型 通義千問夥伴計劃啓動
- ▣ 華爲發佈通信行業首個大模型
- ▣ 數智早參|阿里雲發佈通義千問2.5;谷歌CEO皮查伊:我們仍處AI初期階段
- ▣ 通用大模型創業硬核選手亮相 階躍星辰發佈萬億參數MoE大模型預覽版
- ▣ 出門問問宣佈開放“序列猴子”首個開源數據集
- 阿里雲發佈通義千問2.5 全面趕超GPT-4 Turbo
- ▣ 最強開源大模型Llama 3來了!4000億參數模型狙擊GPT-4,訓練數據量達Llama 2七倍
- ▣ 元象開源650億參數高性能大模型,無條件免費商用
- ▣ 阿里雲發佈通義千問2.5,性能全面趕超GPT-4 Turbo
- 細數開發高雄政績 吳敦義:至今價值數千億元
- ▣ 階躍星辰發佈Step-2萬億參數MoE語言大模型預覽版