叫好不叫座,AI醫(yī)療“卡脖子”難題如何破解?
一直以來,醫(yī)療行業(yè)都被視為AI應用的最佳場景之一。在上一輪AI+醫(yī)療浪潮中,人工智能的應用主要集中在影像領域。那么,在本輪AIGC浪潮中, AI醫(yī)療是否迎來了新的突破口?
近日,紅杉資本發(fā)布了一篇名為《Generative AI in Healthcare》的報告。其中提到,目前AI能夠很好地處理患者互動、文檔記錄、預授權、編碼和收入周期管理等環(huán)節(jié),例如將醫(yī)生和患者的對話,自動轉化為電子病歷和編碼等等。紅杉資本認為,現(xiàn)在的AI開始滲透到醫(yī)療行業(yè)的多個環(huán)節(jié),從而大大提高醫(yī)療領域的效率和質量,降低成本和人力。
那么,除了處理這些看起來不夠前沿的非結構性數(shù)據(jù),醫(yī)療行業(yè)的“卡脖子”領域——醫(yī)療診斷,在這一輪人工智能浪潮中,能否獲得新的解決方案?又有哪些難點?近日,華爾街日報發(fā)布的一篇文章《Can AI Help Doctors Come Up With Better Diagnoses?》給出了一些答案。文章作者為Laura Landro,她專注于醫(yī)學與健康領域方面寫作,出版過書籍《幸存者:控制你與癌癥的斗爭》等。適道對原文內容進行了縮寫和補充,以下是正文。
1
準確性是永遠的痛點
第一,AI無法取代醫(yī)生經(jīng)驗。雖然生成式AI能提出診斷建議,并提示醫(yī)生:患者可能出現(xiàn)的病情趨勢。但在臨床實踐中,除了一張冷冰冰的體檢報告,醫(yī)生還要和患者面對面交流,通過望聞問切、建立聯(lián)系、獲取信任,從細微之處察覺患者的病情起因發(fā)展,排查不符合邏輯的事實。
例如,在肥胖門診中,很多病人會隱瞞自己的真實飯量。醫(yī)生可以環(huán)環(huán)追問,推測出病人實際的飲食和運動情況,從而給出合理的治療方案。但如果將這些“說謊的病人”交給AI,它大概率會陷入錯亂。
第二,AI會“胡編亂造”診斷書。如果說ChatGPT自創(chuàng)參考文獻勉強算得上可愛,那么當它開始自創(chuàng)診斷書,就是可怕了。
英國的一項研究發(fā)現(xiàn): 聊天式AI漏掉重要診斷的概率高達60%,而這些診斷往往會危及生命,也是每個經(jīng)驗豐富的臨床醫(yī)生最關心的問題。
顯然,大部分患者也對AI醫(yī)生也是將信將疑。在一項針對美國成年人的調查中,66%的女性和54%的男性都不太放心AI提供的醫(yī)療服務。
Source: Pew Research Center, survey conducted Dec. 12-18, 2022
2
解決數(shù)據(jù)問題=解決一大半難題
為防止診斷出現(xiàn)誤差,一些基于特定任務而開發(fā)的模型被應用在醫(yī)療領域。
例如,梅奧診所(Mayo clinic)設計了一種可以檢測心房顫動(AFib)跡象的算法,醫(yī)生只需點擊嵌入梅奧電子健康記錄中的AI儀表板,即可查看所有檢查心電圖患者的情況。
哈佛大學和麻省理工學院的一項聯(lián)合研究發(fā)現(xiàn),在胸部X光檢查中,AI的表現(xiàn)比66%了解患者病史的放射科醫(yī)生更為準確。
上述這兩種模型有助于評估風險,幫助醫(yī)生進行下一步檢查和治療。但它們只能執(zhí)行由訓練數(shù)據(jù)集及標簽預先定義的任務,在臨床實踐中無法完成其他任務,靈活性很差。
那么,AI診斷的擔子就落在了更為靈活的大模型上,它們能否勝任?
雖然,在大模型下,AI診斷不再是只給出簡單的結果,它也可以像專家一樣,跟醫(yī)生進行深度討論;大模型帶來的人機自然語言無障礙交互,也可以調動多種能力解決多個場景的問題。
不過也正如上文所舉的第二個例子, 大模型“胡編亂造”的能力是阻礙其在醫(yī)療領域應用的一大絆腳石。
但這個問題也不是不能解決。
首先,技術的進步可以大大改善現(xiàn)狀。
就像第一次工業(yè)革命時期,世界上第一輛火車跑不過馬車,唱衰大模型醫(yī)療診斷還為時過早。
例如,斯坦福大學的研究人員發(fā)現(xiàn),在回答一些臨床推理問題時,GPT-4穩(wěn)贏大二的醫(yī)學生,它不僅比GPT-3.5準得多,甚至沒有一本正經(jīng)地胡說八道。OpenAI表示,雖然GPT-4生成事實內容的可能性比GPT-3.5高出來 40%,但要進一步降低出現(xiàn)“幻覺”,還有很多工作要做。雖然我們不知道要做哪些工作,但至少情況會變得更好。
其次,解決數(shù)據(jù)問題,就能解決一大半難題。
模型的好壞取決于人類喂給它的數(shù)據(jù)。這些數(shù)據(jù)依賴于人類的反饋結果,本身就可能帶有濃重的主觀色彩,并非客觀準確。而當“不夠好”的數(shù)據(jù)充斥其中,人工智能模型賴以生存的良性循環(huán)模式(飛輪效應)也就玩不轉了。
一方面,大型、多樣化的醫(yī)療數(shù)據(jù)集難以獲取。從當前來看,國內大部分醫(yī)療數(shù)據(jù)存儲于各級醫(yī)療機構,業(yè)務系統(tǒng)相對獨立,數(shù)據(jù)較難實現(xiàn)共享,存在明顯的“數(shù)據(jù)孤島”現(xiàn)象。
目前國內AI模型訓練所需要的醫(yī)療數(shù)據(jù),大都是通過企業(yè)和醫(yī)院簽署研發(fā)協(xié)議獲得。在實際操作中,會有專門的模塊進行數(shù)據(jù)清洗,只保留必要的數(shù)據(jù)。而在數(shù)據(jù)收集到模型建立過程中,醫(yī)院和企業(yè)需要做好物理隔離,做到數(shù)據(jù)不出院,模型出院。
另一方面,大量訓練數(shù)據(jù)集意味著高昂的成本。這也就提出了新的挑戰(zhàn):數(shù)據(jù)集合模型究竟要多大才合適?但實際情況卻可能是:收集醫(yī)療數(shù)據(jù)的需求取決于醫(yī)療實際應用情況,甚至無法對數(shù)據(jù)需求做出準確的預估。例如,對于癌癥的診斷,需要由影像科、病理科、腫瘤科醫(yī)生組成的多學科專家小組共同判斷,保證患者拿到一份準確的診斷書。而當這樣的診斷交給AI模型時,其輸出的內容又該如何進行事實核查?
另外,雖然國內已經(jīng)出現(xiàn)了一些AI醫(yī)生,例如阿里健康的AI醫(yī)生號稱能在1.5秒內給出90%準確性的診斷;百度的AI醫(yī)生可以識別900多種常見疾病,但恐怕沒有患者會將其診斷和大醫(yī)院的專家診斷相提并論,這說明了當下最大的問題——你真的相信AI醫(yī)療診斷嗎?
3
哪些賽道勝算最大?
綜上,在新一波人工智能浪潮下,醫(yī)療診斷的AI解決方案依然挑戰(zhàn)不斷,保有很大的想象空間。那么,在AI醫(yī)療其他賽道,有哪些機遇可以被企業(yè)立即抓住?
從市場需求及規(guī)模來看,國內AI醫(yī)療影像、AI藥物研發(fā)依舊是主要的增長突破口。也就是說,屬于上一輪AI醫(yī)療浪潮的任務還沒完成。
醫(yī)學影像科在醫(yī)院發(fā)展過程中扮演著舉足輕重的角色,影像數(shù)據(jù)目前占據(jù)醫(yī)療數(shù)據(jù)的90%,年增長率超過30%;影像報告占據(jù)全部診斷信息的70%;影像科的收入占據(jù)醫(yī)院收入的比重超過25%。
根據(jù)Global Market Insights的數(shù)據(jù),全球AI醫(yī)療影像市場規(guī)模占醫(yī)療AI市場的25%,是僅次于AI制藥的第二大細分市場。對于國內醫(yī)療行業(yè)來說,目前我國醫(yī)療影像數(shù)據(jù)的年增長率高達30%,但是影像科的醫(yī)生年增長率卻只有4%?紤]到醫(yī)生的培訓周期比較長,發(fā)展AI影像醫(yī)療能夠有效緩解醫(yī)療人才短缺的問題,市場仍有較大的增長潛能。
而在AI藥物研發(fā)方面,AI可以有效解決新藥研發(fā)的高成本、低效率和高風險的問題。2020年我國新藥研發(fā)行業(yè)的市場規(guī)模為1.2萬億元,但是新藥研發(fā)的成功率僅為11.3%,即使進入III期臨床成功率也只有53.4%,臨床階段整體費用占比高達70%。
這說明新藥研發(fā)需要投入巨額的資金和時間,但是收益和風險都很不確定。而通過人工智能的認知能力,加速靶點發(fā)現(xiàn)、化合物篩選、藥物設計等環(huán)節(jié),可以有效提高新藥的成功率和質量。
例如2021年,我國AI藥企英矽智能與浙江大學合作,利用自主研發(fā)的AI平臺,對抗癌藥物PD-1抗體進行了優(yōu)化設計,并獲得了美國FDA的臨床試驗許可。這樣的成就顯示了AI技術在新藥研發(fā)方面的潛力,也預示了其規(guī)模化增長的可能。
END
原文標題 : 叫好不叫座,AI醫(yī)療“卡脖子”難題如何破解?

請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞