語音詐財頻傳 臺科大學生發明「護聲符」辨聲音真偽

臺科大資管系學生王玟雅、蔡婷玗、陳俞縕及毛世鑫開發「應用音訊浮水印於對抗式攻擊與深度學習之數位護聲符系統」,獲第29屆大專院校資訊應用服務創新競賽資安應用組第二名及資訊應用組第三名。圖/臺科大提供

近年有不法分子利用AI語音合成技術進行語音詐財,臺灣科技大學4名學生設計語音防護App,能夠辨別語音真僞,以及爲聲音加上特殊的「音訊浮水印」,防止聲音被AI軟體進行二次合成利用。

臺科大資訊管理系學生王玟雅、蔡婷玗、陳俞縕及毛世鑫共同開發「應用音訊浮水印於對抗式攻擊與深度學習之數位護聲符系統」,提供語音防護與真僞辨識,他們設計的「護聲符App」在第29屆大專院校資訊應用服務創新競賽中獲資安應用組第2名及資訊應用組第3名。

王玟雅表示,親友曾經接過陌生來電被誘導進行對話,再加上看到關於語音詐騙的新聞,讓她萌生設計語音防護系統的想法。護聲符App具備語音真僞辨別及數位音訊防護兩大功能,並支援音檔上傳與錄製,除了可以分辨語音是AI還是真人,還能爲聲音加上特殊的「音訊浮水印」,也就是人類聽不見的音頻或標記,防止聲音被AI軟體進行二次合成利用,也能作爲保障聲音版權的依據。

在語音真僞辨識方面,團隊蒐集公開的真人語音資料庫與AI合成音訊,利用偵測模型整合與分類,分析真實語音與合成語音的特徵與差異,訓練出辨識系統,在背景音乾淨情況下,該系統對真人語音的辨識準確率高達99.99%,對AI合成音的辨識準確率則爲 99.94%。

王玟雅指出,接下來規劃完整開發即時通話中的語音辨識與防護功能,並擴展模型的語音數據庫,蒐集更多中文語音樣本進行模型訓練,增強對中文語音的支持。未來則希望可以發展成合規性工具,應用於通信、聲音版權保障、生物特徵驗證、影視製作等領域,成爲具有公信力、保障聲音版權的工具。

指導老師、助理教授黃政嘉指出,聲音權益在近年逐漸受到重視,例如公衆人物的聲音可能被不法分子利用,製作出虛假言論,嚴重影響其聲譽;日本甚至有聲優因聲音遭竊取而影響工作權,但目前聲音版權保障相關法規仍不完善。護聲符App用的技術具有高度市場需求,但開發具公信力的系統面臨諸多挑戰,包括語音樣本的蒐集與模型建構等。