☰

通義千問發佈首個千億級參數開源模型

觀點網訊：4月28日，通義千問宣佈推出1100億參數模型Qwen1.5-110B，標誌着其成爲全系列中首個達到千億級參數的開源模型。該模型繼續沿用了Qwen1.5系列的Transformer解碼器架構，並採納了分組查詢注意力方法，顯著提高了模型在推理過程中的效率。

此110B模型的一大亮點在於其能夠支持長達32K的上下文長度，並且擁有卓越的多語言處理能力。它能夠兼容包括中文、英語、法語、德語、西班牙語、俄語、日語、韓語、越南語以及阿拉伯語在內的多種語言，這一特性使其在全球化的應用場景中具有顯著優勢。

相關資訊

▣ 通義千問開源千億級參數模型
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 通義千問開源320億參數模型
▣ 阿里通義千問開源首個MoE模型
▣ 百川智能發佈千億級參數的大語言模型Baichuan3
AI飛速發展陸10億級參數規模以上大模型已發佈79個
▣ vivo發佈自研藍心大模型：5款大模型覆蓋十億、百億、千億三個量級
▣ 「天工大模型3.0」4月17日正式發佈——同步開源4000億參數MoE超級模型，性能超Grok1.0
▣ 數智早參｜蘋果推出開源大模型OpenELM；阿里雲宣佈EMO模型上線通義APP
▣ 阿里雲發佈通義千問2.5
▣ 國內首個官方大模型評測結果出爐阿里雲通義千問首批通過評測
▣ 大模型加速“上手機” 聯發科與阿里通義千問實現芯片級適配
▣ 剛剛，全球最強開源大模型 Llama 3 發佈：使用 15T 數據預訓練，最大模型參數將超 4000 億
參展MWC 華爲發佈通信行業首個AI大模型
▣ 1760 億參數、大小 281GB，Mixtral 8x22B 開源模型登場
▣ 聯發科攜手阿里雲完成通義千問大模型端側部署
繼百度之後阿里雲AI大模型「通義千問」向大衆開放
▣ 阿里雲推AI大模型通義千問夥伴計劃啓動
▣ 華爲發佈通信行業首個大模型
▣ 數智早參｜阿里雲發佈通義千問2.5；谷歌CEO皮查伊：我們仍處AI初期階段
▣ 通用大模型創業硬核選手亮相階躍星辰發佈萬億參數MoE大模型預覽版
▣ 出門問問宣佈開放“序列猴子”首個開源數據集
阿里雲發佈通義千問2.5 全面趕超GPT-4 Turbo
▣ 最強開源大模型Llama 3來了！4000億參數模型狙擊GPT-4，訓練數據量達Llama 2七倍
▣ 元象開源650億參數高性能大模型，無條件免費商用
▣ 阿里雲發佈通義千問2.5，性能全面趕超GPT-4 Turbo
細數開發高雄政績　吳敦義：至今價值數千億元
▣ 階躍星辰發佈Step-2萬億參數MoE語言大模型預覽版

DMCA | PRIVACY | s@bg3.co