臺灣AI引擎TAIDE再升級 國科會釋出8B模型

臺版大型繁中語言模型再升級,國科會今天宣佈,釋出以最新Llama 3爲基礎的「可信任人工智慧對話引擎」(TAIDE)參數量80億(8B)模型,且團隊僅用4天就完成模型訓練,並能馬上開放可商用版本供產學研界使用。

爲因應國際大型語言模型常產生資訊偏誤,或不符臺灣文化與價值觀的迴應,國科會去年4月啓動TAIDE計劃,在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校,先前已推出7B版本。

國科會今天指出,Meta於4月19日公開釋出Llama 3新一代的大型語言模型,在各項評比中表現大幅超越前一代Llama 2,再次引爆LLM界的熱潮。

爲儘快提升以Llama 3爲基礎、具臺灣文化的繁中模型,TAIDE團隊第一時間以過去1年開發TAIDE模型所掌握的經驗,加上累積整理的繁體中文資料集,基於「Release early, release often」的開發思維,僅以4天時間投入訓練,經過基本測試,今天釋出Llama 3-TAIDE-LX-8B-Chat-Alpha1模型。

國科會主委吳政忠對於TAIDE團隊僅用4天旋即完成模型訓練,並能馬上開放可商用版本供產學研界使用,表示高度肯定。國科會提到,團隊後續也將收集各界回饋意見並滾動調整,持續精進TAIDE系列繁體中文大型語言模型。

國科會進一步說明,自今年4月15日公開釋出以Meta提供開放模型Llama2爲基礎的TAIDE-LX-7B繁中可商用大型語言模型,目前在開放社羣平臺上,許多高手已提供不少安裝與使用指南,也有10餘家廠商及多個學研團隊及公部門開始導入TAIDE模型開發相關應用系統。

國科會強調,民衆現在可以進入TAIDE官方網站,瞭解模型發展目標與歷程,並點入網站上「TAIDE模型」連結,再進入該頁面中提供的Huggingface連結下載,就可開始使用並體驗具有臺灣特色的大型語言模型。