全網“最醜”驗證碼上線 助力醫療影像標註及診斷

2月3日,一批“特殊”的驗證碼上線,與其他常見的圖片驗證碼不同,它們全部由清一色的黑白灰圖片構成。

這批驗證碼全名爲“MedCAPTCHA 醫學圖像驗證碼”,由騰訊安全平臺部和深圳大學生物醫學工程學院合作研發,驗證中所用到的圖片,全部來自於臨牀上真實的脫敏醫學圖像,通過驗證碼的形式開放給廣大網民自願體驗及參與標註。

雙方期望運用技術力量,解決社會醫療流程和資源存在的痛點,讓醫療影像的標註和診斷變得更加高效和準確,進而減少病人延誤診斷或漏診的情況。

目前,在騰訊防水牆官灰度上線後,已有近萬名用戶體驗了MedCAPTCHA醫學圖像驗證碼,累計貢獻了近2萬條正確標註的醫學圖像數據項目也在持續迭代優化中。

MedCAPTCHA醫學圖像驗證碼已在騰訊防水牆官網灰度上線

醫學診療和研究的“路標

在醫學上,90%的臨牀診斷需要藉助經過標註的醫學影像——病竈和相關器官的有效標註數據,能幫助醫生疾病診斷病情評估、發展趨勢預測、治療策略制定等方面,提供重要的定量化信息

被標註的醫學圖像,融入了專家的經驗知識與判斷,能夠縮減廣大醫務人員的重複工作和勞動時間,還可以應用在AI輔助醫學診斷等領域,有效推動醫學研究和臨牀診療的高效開展。

但現階段對於有限的醫務人力資源而言,醫學圖像的勾畫標註,是一項相當龐大而繁雜的工作。僅僅是針對單個病人的一組醫學圖像,簡單的需要半小時完成勾畫,複雜的則要花上一兩小時。

在過去的四十年中,學術界工業界的研究人員研發了大量基於人工智能輔助的半自動甚至全自動的標註算法,但是這些算法模型,往往需要經過足夠多的標註醫學圖像數據訓練,才能達到普適性更強、準確度更高的分類或診斷效果。因此,快速獲取海量的、具有準確標註的醫學圖像數據,對醫療領域來說困難且迫切,僅僅依靠少數專業醫務者或醫學研究人員的力量遠遠不夠

安全驗證技術與醫學的跨界融合

驗證碼是一種人機識別手段,其主要作用是防止垃圾註冊、刷量刷票論壇灌水等惡意行爲。從安全角度出發,其主要意義是降低某一些用戶用特定程序暴力破解方式進行網站登錄,獲取相關驗證用戶的信息,保證用戶的信息安全

公開數據顯示,全球網民每日累計輸入驗證碼近2億次,而我國網民規模超過9.4億。按照這一數據估算,如果藉助龐大網民羣體的力量,就能夠在1小時內勾畫完成4家大型醫院整整一年所需的醫學圖像標註量。

基於這一想法,騰訊安全平臺部防水牆團隊與深圳大學醫學工程學院高毅教授團隊合作研發並灰度上線了“MedCAPTCHA醫學圖像驗證碼”公益實踐項目,供廣大網民自願體驗。研發人員把深圳大學提供的未經標註的海量脫敏醫學圖像,以圖片驗證碼的形式上線防水牆官網。

MedCAPTCHA在線驗證模式

在這個自願體驗的安全驗證環節中,用戶只需要參照給出的圖片示例“照貓畫虎”,移動鼠標在圖片上進行簡單勾畫,就能完成在線驗證,併成功提供了一次醫學圖像標註答案

針對嚴肅而細緻的醫學研究及診療場景,人機驗證模式讓廣大網民參與到醫學圖像標註的初篩工作中來。而對於收集到的圖像標註信息,專業醫學研究人員會在後臺對收集到的圖像標註信息進行融合和篩選處理,最終將質量最優的數據提供給大數據工作者和醫生羣體。

人工識別標註的結果,將爲公共醫療統計、精準醫療分析提供可靠的、核心的影像特徵基礎,還可以作爲機器學習的訓練樣本,促進人工智能在醫療領域的更多應用。該公益項目也正在聯合騰訊用戶研究與體驗設計團隊(CDC)持續迭代優化中。

即使是不具備任何專業醫學知識的普通網民,也能起到至關重要的作用,共同助力醫療影像的標註和診斷變得更高效、更準確。(馬琳