喉嚨卡卡有解!元智研發病理嗓音偵測系統 保嗓音健康

元智大學學生莊宗穎展示病理嗓音偵測系統。(元智大學提供)

元智大學電機師生團隊研發病理嗓音偵測系統,圖爲系統介面。(元智大學提供)

元智大學校長吳志揚(右)測試嗓音健康。(元智大學提供)

嗓音問題是現代社會中十分常見的健康疾病,常見的聲帶疾病包括聲帶結節息肉囊腫,元智大學電機系教授方士豪帶領實驗室同學,結合亞東醫院耳鼻喉科臨牀收集逾千例的嗓音資料庫,應用深度學習演算法,成功偵測嗓音健康狀況。只要對麥克風母音發音持續一秒,即可替聲紋把脈,瞭解發音人聲帶健康狀況。

嗓音問題與疾病好發於職業用聲者、女性、用聲習慣不良、以及特殊個人體質。由於聲帶位處喉部深處,非專科醫師與特殊儀器難以進行檢查,時常造成民衆就醫與基層醫師轉介之延遲,增加社會負擔與醫療成本。

方士豪表示,這項研究學習患者聲學特徵與臨牀症狀等綜合數據,能自動化對嗓音障礙個案進行偵測,可應用於智慧醫療服務,也是人工智慧在病理嗓音偵測上的重大跨域創新應用之一。

方士豪說,中醫診察疾病常雲「望聞問切」,其中的聞即是指聽病人說話。透過元智開發的偵測系統,可提前於患者就醫前之嗓音訊號分析,預先挑選有潛在疾病之患者。此技術不僅節省醫療資源,更可提供醫療匱乏地區之遠端諮詢,減少患者往返醫院舟車勞頓。日後若配合物聯網環境,可在法規允許下達成早期發現與治療之效益

方士豪表示,元智大學所開發的病理嗓音偵測系統,在亞東醫院嗓音障礙資料庫可達到94.26%之診斷正確率。與各國最新技術相比,在公開資料庫以及同樣的實驗條件下可從98%偵測率再進一步提升至99.1%,爲目前文獻中最好的效能研究成果已發表於知名國際期刊,是全球第一篇基於深度學習偵測病理嗓音之論文。並已獲得中華民國發明專利,也同步申請中國大陸與美國之專利中。

方士豪研究團隊除元智大學電機師生外,亦包含亞東醫院耳鼻喉科王棨德醫師,林峰語言治療師中研院資創中心曹昱副研究員等人。本研發技術受到科技部人工智慧技術暨全幅健康照護聯合研究中心,與元智大學生技醫療與健康照護創新研究中心的計劃支持。

同時,元智大學與亞東醫院將於今年底合辦病理嗓音國際競賽,在頂尖國際會議2018 IEEE International Conference on Big Data展開。此會議是美國電子電機協會中大數據領域旗艦型國際會議,今年12月於西雅圖舉辦。此國際會議具有極高的國際聲望,今年度全球僅有兩個競賽脫穎而出能夠入選,元智大學主辦的病理嗓音偵測競賽便是其中之一。此競賽至今爲止已有109隊報名註冊,來自27個的不同國家包含臺灣,美國,中國,印度,南韓

元智大學表示,這項競賽是全球第一個病理嗓音偵測的公開競賽,而開放的亞醫資料庫也是目前亞洲唯一一個具醫師與語言治療師完整標記的嗓音資料庫,因此在該領域造成極大的迴響。此競賽之獲選,證實元智大學在該領域已具初步規模與國際領先地位,預期可提升臺灣的國際聲望與學術能見度,技術也具有產業價值。