臉書「翻譯年糕」再進化!導入人工智慧分析前後文
Facebook 的「翻譯年糕」現在不只想當一塊年糕,臉書想讓它成爲「哆啦A夢」啦!不過並不是讓它將擁有百寶袋,而是將拋棄過去短句、單字的翻譯方式,改用神經機器翻譯(Neural Machine Translation),讓系統自動依據上下文意思進行翻譯。
▲臉書爲貼近在地文化,將翻譯改爲「翻譯年糕」可愛的名稱。(圖/翻攝網路)
爲了讓臉書上 20 億人能夠不受限於語言自由溝通,臉書團隊希望提升翻譯品質,但這並不是向簡單的工作,因爲我們終究是人類,各種口語化的用法對於翻譯系統而言是一大挑戰。因此臉書團隊將使用卷積神經網路(Convolutional Neural Networks,CNN)、遞迴神經網路(Recurrent Neural Networks,RNN)等系統來提升翻譯品質。
過往臉書的翻譯系統並非無法使用,但它只能分辨單一詞性與短句,因此一旦拉長對話,或者使用幾個明顯意涵不同的單字,翻譯就會呈現凌亂、無法理解的狀況,新的神經網路系統會考慮上下文之後再進行翻譯,臉書提供兩組由土耳其文翻譯至英文的示範,我們可以明顯的發現,下圖的英文翻譯是優於上圖的。
▲上圖的翻譯句型不符合我們常見的文法,下圖則比較接近。(圖/翻攝臉書)
臉書人工智慧研究(FAIR)團隊在三個月的時間內,先是運用 CNN 系統推出英文翻譯至德文、法文兩組系統,翻譯品質分別提高12%、14.4%,此外研究團隊也希望持續進化這項功能,讓系統而根據其他條件翻譯出更精準的意思,例如運用文本附帶的圖片,加以判斷文章內容。
▲Google 翻譯早在去年就開始使用神經機器翻譯系統。(圖/記者洪聖壹攝)
不過神經機器翻譯,微軟與 Google 在 2016 年就已經開始使用,Google 小姐也早已具備神經機器翻譯系統,臉書在這個項目上顯然落後對手一拍,不過現在加緊腳步跟上,臉書的功能將有機會比 Google 翻譯更常被使用,畢竟他們可是擁有超過 20 億使用者長期駐紮啊。