醫(yī)生與AI,誰更需要誰?陶大程博士淺談AI與醫(yī)療
AI毫無疑問是當下最火的概念之一,據《2018世界人工智能產業(yè)發(fā)展藍皮書》顯示,截至2018年上半年,在全球范圍內共監(jiān)測到AI企業(yè)4998家,其中,中國的AI公司達1040家。在這其中,針對醫(yī)療健康的AI應用又占據了最大的比例,達到22%之多。這也就不難理解8月30日在上海徐匯西岸舉辦的“2019全球人工智能健康峰會”為什么能夠吸引全球人工智能領域的大咖們齊聚于此了。
作為“世界人工智能大會”的主題論壇之一,本次峰會由聯(lián)合國國際電信聯(lián)盟ITU作為指導單位,在上海市經濟和信息化委員會,上海市衛(wèi)生健康委員會、徐匯區(qū)人民政府、中國信通院和互聯(lián)網醫(yī)療健康產業(yè)聯(lián)盟的共同組織下,由中國信通院華東分院負責具體會議落地執(zhí)行。
這其中,悉尼大學工程學院計算機系陶大程博士在包括計算機視覺、機器學習及相關應用方面的研究獲得了不少讓你側目的學術成就。因此,他在2018年當選澳大利亞科學院院士。
在剛剛公布的2019年NeurIPS論文入選完整名單中,陶大程博士共有8篇論文入選,全球排名第六。盡管對AI有著長期的看好,陶大程博士對于當下AI的現(xiàn)實依然有著清醒的認識,并在峰會上做了《恰AI少年》的演講。
作為這個行業(yè)的觀察者,動脈網也有幸對陶大程博士進行了專訪。全球頂尖AI專家是如何看待AI和醫(yī)療的呢?
醫(yī)生和AI,誰更需要誰?
1956年8月,在位于美國漢諾斯鎮(zhèn)的達特茅斯學院中,約翰·麥卡錫(John McCarthy)、馬文·閔斯基(Marvin Minsky)、克勞德·香農(Claude Shannon)、艾倫·紐厄爾(Allen Newell)和赫伯特·西蒙(Herbert Simon)等科學家討論了有關用機器來模仿人類學習以及其他方面的智能。這場為期兩個月的會議雖然沒有達成普遍的共識,但至少為他們所討論的內容起了一個名字,即AI(Artificial Intelligence,人工智能)。
從那開始至今,AI的發(fā)展幾經起落,如今已經進入了第三次人工智能的發(fā)展高潮——隨著大數(shù)據和超級計算的支持,深度學習成為現(xiàn)實并逐漸成熟。
如今,AI在醫(yī)療領域已經可以起到各種各樣的作用,主要體現(xiàn)在四個方面。首當其沖的便是目前應用最為廣泛、成熟的機器視覺技術,比如,肺結節(jié)CT和眼底篩查。這些AI輔助診斷手段的加入,大大提升了醫(yī)生的閱片速度和病征識別率,協(xié)助醫(yī)生解決了患者相當多的問題。
自然語言處理技術也隨著深度學習的發(fā)展開始逐漸成熟起來,由此衍生出對電子病例的分析。通過語音識別系統(tǒng),幫助醫(yī)生快速進行語音病例的錄入,并讓病人的病例變得更加結構化,為后續(xù)診療做出很多幫助。同樣依托語音識別技術,同病人進行交互的輔助導診機器人也可以對病人的疾病風險進行評估。醫(yī)院可以減輕負擔,門診壓力得以減緩,醫(yī)生也可以盡早找到那些最需要進行診斷的病人,幫助病人減輕一些經濟上的負擔。
增強學習則被廣泛應用到機器人中。如今的手術機器人不僅可以縫合傷口,也可以進行微創(chuàng)手術。在以往,醫(yī)生隨著年紀的增長或者傷病的原因會出現(xiàn)手抖,導致無法勝任手術。通過引入手術機器人,配合醫(yī)生豐富的經驗,能夠讓這部分醫(yī)生揚長避短,延長職業(yè)壽命。
最后,則是利用AI進行數(shù)據挖掘。包括新藥研發(fā)和未來的精準醫(yī)療,都需要用到數(shù)據挖掘的相關技術。
AI在近年的發(fā)展速度如此之快,以至于一些樂觀主義者開始暢想,在未來的某個時候,AI將會取代醫(yī)生的場景。不過,在陶大程博士看來,AI取代醫(yī)生、或者說普通人在可預見的未來還很困難。
人類可以很容易地理解現(xiàn)實場景,認出場景中的人和各種物體。但是,同樣的任務對于AI來說卻充滿挑戰(zhàn)。為了幫助AI理解圖像和視頻,需要有非常高效的表征學習算法來有效地表達圖像視頻中的像素。目前的表征學習已經可以從原始數(shù)據中學到更精確的特征;同時,去除或者盡可能減弱數(shù)據中的冗余信息和噪聲。
借助先進的表征學習,AI的確已經能夠在識別、檢測和分割等特定的視覺識別任務中、特定的數(shù)據庫上達到甚至超越人類的表現(xiàn)。但在不少其他方面,比如簡單加減法運算和圖像中物體關系的理解等方面,AI還不如十來歲的孩童。“人工智能的目標是模擬人的智能。距離這樣的期望,我們還有相當?shù)木嚯x,還要繼續(xù)努力!碧沾蟪滩┦窟@么認為。
醫(yī)療數(shù)據通常具有多個模態(tài),需要采集病人各種各樣的指標,包括年齡、性別、尿樣、血樣、CT和X光片等等。這樣的多模態(tài)數(shù)據可以幫助醫(yī)生對病人進行完整的畫像。如同盲人摸象一樣,單一數(shù)據并不能對病癥做出判斷,只有將不同模態(tài)的數(shù)據組合起來才能看到事物的全貌。只要有足夠多模態(tài)的數(shù)據,理論上可以重構上帝視角,因此對病人的畫像建模就會變得更加準確。
目前AI在醫(yī)療應用中最常見的莫過于肺結節(jié)識別,這一模型實際上是由AI企業(yè)利用可以獲取的數(shù)據訓練而來。當將其部署到實際應用中時,醫(yī)院發(fā)現(xiàn)企業(yè)訓練的模型識別準確率并不高。這主要是因為AI企業(yè)的用于訓練模型的數(shù)據和醫(yī)院的數(shù)據,在分布上存在差異。
解決這一問題的關鍵在于獲取大量的、同一分布的、精確標注的數(shù)據,來訓練精確的AI模型。舉個例子,即使我們訓練一個自然圖像的高精度物體檢測模型,也需要使用百萬級別的數(shù)據庫、千萬級別的標簽。對于醫(yī)學圖像,數(shù)據的標注是需要由經過專業(yè)訓練且經驗豐富的醫(yī)生才能實施,普通人并不能完成這個任務?上攵,把AI應用于醫(yī)療是非常有挑戰(zhàn)的。因此,醫(yī)療AI公司同時要考慮如何設計高效的數(shù)據標注工具,減輕醫(yī)生標注數(shù)據的工作量。
那么,假設有足夠的高質量數(shù)據來學習,AI在未來有沒有可能從專精一兩種疾病向更多病種去進化呢?陶大程博士認為這是非常富有挑戰(zhàn)的。經過嚴格培養(yǎng)的醫(yī)生專精于某種疾病,很難涉足其他不同的病種。
特定的AI算法也只是為單一任務服務,要想進行多任務學習并不容易——盡管研究人員一直在為此努力。如何有效地組織不同類型的、但是相關的任務是多任務學習的一個難題。
把沒有關聯(lián)的任務、甚至目標本身矛盾的任務放在一起來訓練多任務模型甚至會降低學習到的模型的精度。
與此同時,醫(yī)學影像還存在同病異影或者同影異病的問題。要解決這個問題仍然需要醫(yī)生來進行深刻的分析。醫(yī)生對不同類型疾病之間關聯(lián)(一種疾病會導致另外一種疾。┑睦斫饽芰κ悄壳暗腁I所難以具備的。
與此同時,并非所有疾病都能有足夠的標注數(shù)據。常見疾病容易獲得足夠的標注數(shù)據,罕見病則完全沒有足夠的數(shù)據訓練模型。如果再將罕見病本身在醫(yī)學上就沒有完全一致的標準這個因素考慮進去,問題就變得更加復雜了。
陶大程博士認為,AI是數(shù)據驅動的,通過醫(yī)生的高質量數(shù)據標注才是最終實現(xiàn)醫(yī)療輔助診斷的基礎。

請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞