臺版ChatGPT TAIDE會寫作翻譯

中研院與國科會等單位合作推臺版ChatGPT「TAIDE」,國科會主委吳政忠表示,最快今年四月中釋出商用TAIDE-7B開放業者用於研發,屆時有望將TAIDE模型內建於電腦、手機等裝置內。中研院長廖俊智昨在立院答詢時則提到,爲豐富繁體中文版ChatGPT資料庫,將努力排除法規限制,儘可能開放院內資料提供ChatGPT語言模型訓練。

國際大型語言模型(LLM)時常產生偏誤或不符本土文化的迴應,國科會於去年四月啓動TAIDE計劃,欲打造臺灣專屬大型語言模型,目前已開發商用版本TAIDE-7B,以及學研用版本TAIDE-13B模型。

國科會昨提供媒體實測,由TAIDE-13B試寫學測國文寫作題,進而撰寫具備起承轉合的文章;現場亦由媒體出題,由TAIDE撰寫邀訪信。

國科會副執行秘書楊佳玲表示,國際上訓練LLM時,中文仍以簡體資料庫爲主,內容便容易偏離臺灣文化和價值觀,因此臺灣必須打造自己的大型語言模型。

楊佳玲說,目前TAIDE-13B在撰寫文章、信件、摘要、中翻英以及英翻中時,表現已和ChatGPT3.5相當,且擁有更豐富的在地知識。

廖俊智昨赴立院業務報告時,立委陳秀寶提到,生成式AI需要大量資料做訓練,但現階段繁體中文的資料庫遠少於簡體,加上抖音、小紅書,讓臺灣學子接收大量簡體中文,擔憂繁體中文未來會淪爲弱勢,要求中研院協助整合繁體中文的語言資料。另有立委關心臺灣AI立法進度。

廖俊智表示,臺灣AI立法精神應該是「以人爲本」,爲豐富繁體中文版ChatGPT的資料庫,會在不違智財權法規的限制下,儘量開放中研院資料庫訓練AI。