APP拍照捕捉情緒、年紀 微軟推出《Seeing AI》助盲人

實習記者黃肇祥臺北報導

世界許多廠商都在搶攻 AI 人工智慧領域,去年才成立 AI 研究小組的微軟自然也不想錯過,除研發 AI 助理 Cortana 以及 Skype 聊天機器人外,更發佈一款能夠幫助障者看見世界的 APP。

▲微軟推出結合 AI 的 《Seeing AI》,透過手機鏡頭捕捉周遭環境資訊。(圖/翻攝微軟)

《Seeing AI》能借由相機捕捉物體或人,並透過 AI 分析加以辨認,最大的特色在於能夠捕捉人類臉部並加以解讀情緒,接着寫下敘述性文字,幫助視障者瞭解周遭的環境,此 APP 還能透過掃描商品條碼讀取商品資訊與價格,如果相機鏡頭未能對準物件,AI還能領導使用者瞄準正確的位置。

APP 的開發者之一 Saqib Shaikh 也是名視障者,他在 BBC 的記者面前展現《Seeing AI》可以如何幫助視障者生活。Shaikh 先是將手機對準未知的檔案文件,手機開始大聲朗讀文件內容,接着在現場一片吵雜的情況下,手機引導他至罐裝飲料的條碼位置,讓他可以得知手上的飲料究竟是茶還是可樂,最後 Shaikh 切換至人體模式(People Mode),《Seeing AI》開始描述眼前的記者,「一名 52 歲的男子,看起來很中性、很開心。」

▲Seeing AI 可以辨識性別、年紀與情緒,不過年紀被揭露或是被辨識得更老,會惹對方不開心吧?(圖/翻攝微軟)

微軟首席發言人 Steve Clayton 表示,目前微軟專注研究 AI 的語言、溝通、視覺三個部分,「你可以在這個 APP (Seeing AI)看到,這項技術真的走入生活,並且帶領我們到一個新的領域,AI 擁有與人類對世界相同的認知。」在發表會上,微軟還展示 PPT 即時的標題、文字翻譯,並表示公司不僅僅爲了商業利益,同時也熱衷於自己所揹負的使命。

▲辨識圖片內的文字,對於 Seeing AI 不是難事,還可以爲視障人士朗讀內容。(圖/翻攝微軟)

《Seeing AI》的臉部辨識是直接內裝在軟體內,不必再連上網路,比起其他類似功能的 APP 更加迅速,不過描述場景與文件識讀等功能,仍要開啓網路才能使用。目前《Seeing AI》可以在 iOS 商店免費下載,但只提供給美國區域的使用者測試,未來是否會登陸 Andriod 或應用在智慧穿戴裝置上暫時不得而知。