訂閱
糾錯(cuò)
加入自媒體

機(jī)器學(xué)習(xí)如何解決看病難?

機(jī)器學(xué)習(xí)對(duì)臨床醫(yī)生的工作有何幫助

預(yù)后

機(jī)器學(xué)習(xí)模型可以學(xué)習(xí)患者的健康軌跡模式。它可以得到超出醫(yī)生個(gè)體經(jīng)驗(yàn)的信息,幫助醫(yī)生以專(zhuān)家水平預(yù)測(cè)出未來(lái)可能發(fā)生的事件。例如,患者重返工作崗位的概率有多大?疾病發(fā)展的速度會(huì)有多快?相同類(lèi)型的預(yù)測(cè)可以在眾多患者中可靠地識(shí)別出將出現(xiàn)高危情況或可能頻繁需要醫(yī)療護(hù)理的患者,這些信息可以作為附加信息幫助醫(yī)生。

大型綜合衛(wèi)生系統(tǒng)已經(jīng)在用簡(jiǎn)單的機(jī)器學(xué)習(xí)模型了,它可以自動(dòng)識(shí)別可能需要轉(zhuǎn)移到重癥監(jiān)護(hù)室的住院患者,回溯性研究表明,可以用 EHR 和醫(yī)學(xué)圖像中的原始數(shù)據(jù)建立更復(fù)雜也更準(zhǔn)確的預(yù)后模型。

構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)需要用患者的縱向整合數(shù)據(jù)進(jìn)行訓(xùn)練。只有當(dāng)訓(xùn)練模型的數(shù)據(jù)集中包含結(jié)果時(shí),模型才能學(xué)習(xí)到患者的情況。但數(shù)據(jù)現(xiàn)在都是獨(dú)立存儲(chǔ)在 EHR 系統(tǒng)、醫(yī)學(xué)影像存檔和交互系統(tǒng)、付款人、PBM(Pharmacy Benefits Managers,藥品福利管理)甚至患者手機(jī)上的應(yīng)用中的。自然的解決方案是將數(shù)據(jù)系統(tǒng)交到患者自己手中,這也是我們長(zhǎng)期以來(lái)一直倡導(dǎo)的解決方案,現(xiàn)在這一想法也已經(jīng)通過(guò)快速采用患者控制的應(yīng)用程序編程接口得以實(shí)現(xiàn)。

像 FHIR(Fast Healthcare Interoperability Resources,快速醫(yī)療互操作性資源)這樣將數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一格式可以更有效地聚合數(shù)據(jù);颊呖梢詻Q定哪些人可以用他們的數(shù)據(jù)來(lái)構(gòu)建或運(yùn)行模型。盡管有人擔(dān)心技術(shù)的互操作性無(wú)法解決 EHR 數(shù)據(jù)中普遍存在的語(yǔ)義標(biāo)準(zhǔn)化問(wèn)題,但 HTML(Hypertext Markup Language,超文本標(biāo)記語(yǔ)言)可以索引 Web 數(shù)據(jù),還可以用在搜索引擎上。

診斷

每一位患者都是獨(dú)一無(wú)二的,但最好的醫(yī)生可以在正常范圍內(nèi)確定患者特有的微弱信號(hào)或異常值?梢杂脵C(jī)器學(xué)習(xí)檢測(cè)出的統(tǒng)計(jì)模式幫助醫(yī)生識(shí)別診斷不到的病癥嗎?

醫(yī)學(xué)研究所的結(jié)論是,幾乎每一位患者在他(她)的一生中都會(huì)遇到一次誤診,而正確的診斷是采用合適治療方法的基礎(chǔ)。這個(gè)問(wèn)題不止在一些罕見(jiàn)的病癥中會(huì)出現(xiàn)。在發(fā)展中國(guó)家,即便有充足的治療手段、檢查時(shí)間和培訓(xùn)充分的醫(yī)護(hù)人員,也無(wú)法檢查出急性胸痛、肺結(jié)核、痢疾以及分娩期間的并發(fā)癥。

常規(guī)醫(yī)療護(hù)理期間收集到的數(shù)據(jù)表明,可以在臨床診斷中用機(jī)器學(xué)習(xí)來(lái)判斷可能的診斷,這樣可以提高對(duì)以后可能出現(xiàn)的情況的認(rèn)識(shí)。但這樣的方法有局限性。生疏的臨床醫(yī)生可能無(wú)法正確提取模型必需的信息,因而無(wú)法讓模型變得有意義。模型得到的結(jié)果可能建立在臨時(shí)或錯(cuò)誤的診斷之上,可能建立在不能證明是病癥的不良反應(yīng)條件之上(從而造成過(guò)度診斷),可能受計(jì)費(fèi)的影響,或者可能根本沒(méi)有記錄。但模型會(huì)根據(jù)這些實(shí)時(shí)收集的數(shù)據(jù)給醫(yī)生提出建議,這些建議在誤診率很高和臨床醫(yī)生不確定的情況中是很有用的。在臨床上正確的診斷和 EHR 中或報(bào)銷(xiāo)索賠中的記錄的不一致意味著臨床醫(yī)生應(yīng)該從一開(kāi)始就參與到產(chǎn)生數(shù)據(jù)的過(guò)程中來(lái),這些數(shù)據(jù)會(huì)作為常規(guī)護(hù)理的一部分,而且之后還會(huì)用于自動(dòng)診斷過(guò)程。

訓(xùn)練成功的模型可以回溯識(shí)別各種圖像類(lèi)型的異常(表 1)。但將機(jī)器學(xué)習(xí)模型作為臨床醫(yī)生常規(guī)工作一部分的回溯試驗(yàn)的數(shù)量非常有限。

治療

在數(shù)萬(wàn)名醫(yī)生要治療數(shù)千萬(wàn)患者的大型醫(yī)療系統(tǒng)中,患者在什么時(shí)候?yàn)槭裁淳驮\以及情況相似的患者應(yīng)該如何治療都是有差異的。模型是否可以對(duì)這些差異進(jìn)行分類(lèi),從而幫助醫(yī)生確定首選治療途徑?

一個(gè)比較簡(jiǎn)單的應(yīng)用是比較定點(diǎn)照護(hù)(point of care)的處方和模型得到的處方,可以將差異標(biāo)記出來(lái)后再次核查(例如,其他臨床醫(yī)生傾向于使用可以反映新方法的替代療法);跉v史數(shù)據(jù)訓(xùn)練的模型只能學(xué)習(xí)醫(yī)生的處方習(xí)慣,但這并不一定是理想做法。為了了解療效最好的藥物和治療方法,需要精心收集數(shù)據(jù)并評(píng)估因果效應(yīng),而機(jī)器學(xué)習(xí)模型則不一定能(有時(shí)候也不能用給定的數(shù)據(jù)集)識(shí)別這些效應(yīng)。

根據(jù)觀察數(shù)據(jù)比較療效研究和實(shí)用性實(shí)驗(yàn)的傳統(tǒng)方法也提供了重要看法。但近期使用機(jī)器學(xué)習(xí)方法的試驗(yàn)表明,和專(zhuān)家一起生成人工篩查過(guò)的數(shù)據(jù)集、更新模型以納入新發(fā)表的數(shù)據(jù)、根據(jù)不同領(lǐng)域的處方進(jìn)行調(diào)整以及從 EHR 中自動(dòng)提取相關(guān)變量都是很大的挑戰(zhàn)。

還可以用機(jī)器學(xué)習(xí)自動(dòng)選擇患者,根據(jù)臨床記錄,這些患者可能適合進(jìn)行隨機(jī)對(duì)照試驗(yàn);或者可以用機(jī)器學(xué)習(xí)自動(dòng)識(shí)別可能用早期研究或新療法治愈的高風(fēng)險(xiǎn)患者或亞群。這些工具促使醫(yī)療健康系統(tǒng)研究每一種臨床情況,可以在降低成本和管理費(fèi)用的同時(shí)進(jìn)行更嚴(yán)格的研究。

臨床工作流程

EHR 的引入提高了數(shù)據(jù)的可用性。但這些系統(tǒng)也因費(fèi)用過(guò)高、管理文檔的復(fù)選框過(guò)多、用戶界面不夠友好、輸入數(shù)據(jù)花費(fèi)的時(shí)間過(guò)長(zhǎng)以及產(chǎn)生新的醫(yī)療錯(cuò)誤等讓臨床醫(yī)生們灰頭土臉。

也可以將機(jī)器學(xué)習(xí)技術(shù)用在其他消費(fèi)產(chǎn)品中以提高臨床醫(yī)生們的效率。驅(qū)動(dòng)搜索引擎的機(jī)器學(xué)習(xí)可以在無(wú)需臨床醫(yī)生多次點(diǎn)擊的情況下找出患者數(shù)據(jù)的相關(guān)信息。用機(jī)器學(xué)習(xí)技術(shù)(如預(yù)測(cè)類(lèi)型、語(yǔ)音聽(tīng)寫(xiě)和自動(dòng)摘要等)可以大大改進(jìn)表格和文本數(shù)據(jù)的輸入。根據(jù)患者表格中的信息自動(dòng)授權(quán)支付的模型可以取代提前授權(quán)。使用這些工具不僅僅只是為了方便醫(yī)生。無(wú)障礙地查看和輸入臨床上的有效數(shù)據(jù)對(duì)捕獲和記錄醫(yī)療健康數(shù)據(jù)來(lái)說(shuō)至關(guān)重要,這反過(guò)來(lái)也可以在機(jī)器學(xué)習(xí)的輔助下為每一位患者提供最好的醫(yī)療護(hù)理幫助。最重要的是,這種做法提高了效率、簡(jiǎn)化了記錄,而且改進(jìn)了自動(dòng)化臨床工作流程,這樣臨床醫(yī)生就可以把更多的時(shí)間花在患者身上。

在 EHR 系統(tǒng)之外,機(jī)器學(xué)習(xí)技術(shù)也可以用于外科手術(shù)的實(shí)時(shí)視頻分析,可以幫助外科醫(yī)生避免在關(guān)鍵結(jié)構(gòu)解剖時(shí)出現(xiàn)問(wèn)題或者患者身體有意料之外的改變,甚至可以處理更普通的任務(wù)——比如準(zhǔn)確計(jì)算手術(shù)海綿的數(shù)量。檢查清單(checklist)可以避免手術(shù)錯(cuò)誤,還可以自動(dòng)監(jiān)控手術(shù)過(guò)程,提高手術(shù)的安全性。

在臨床醫(yī)生的個(gè)人生活中,他們可能在自己的智能手機(jī)上用到了所有這些技術(shù)的變體。盡管有將這些技術(shù)應(yīng)用于醫(yī)學(xué)背景的概念驗(yàn)證的研究,但主要的障礙不是模型的開(kāi)發(fā),而是技術(shù)的基礎(chǔ)設(shè)施——EHR 之上的法律、隱私和政策框架、衛(wèi)生系統(tǒng)以及技術(shù)供應(yīng)商。

擴(kuò)大臨床專(zhuān)業(yè)知識(shí)的可用性

醫(yī)生不可能照料到所有需要治療的患者。機(jī)器學(xué)習(xí)是否可以在不需要醫(yī)生親自參與的情況下,擴(kuò)大醫(yī)生診治范圍、提供專(zhuān)家級(jí)醫(yī)療評(píng)估呢?例如,剛剛發(fā)皮疹的患者可能只要用手機(jī)發(fā)送一張照片就可以獲得診斷,從而避免掛不必要的急診。本身要去急診室就診的患者可能在自動(dòng)診斷系統(tǒng)就能獲得診斷,并在適當(dāng)?shù)臅r(shí)候以另一種形式進(jìn)行護(hù)理。當(dāng)患者確實(shí)需要專(zhuān)業(yè)幫助時(shí),模型也可以識(shí)別出專(zhuān)業(yè)最相關(guān)且處于空閑狀態(tài)的醫(yī)生。同樣,為了提高舒適度并降低成本,如果機(jī)器可以遠(yuǎn)程監(jiān)控病人的傳感器數(shù)據(jù),本身需要住院治療的病人就可以在家里接受護(hù)理了。

世界上有一些地區(qū),直接學(xué)習(xí)醫(yī)學(xué)專(zhuān)業(yè)知識(shí)的渠道有限,而且非常復(fù)雜,因而將機(jī)器學(xué)習(xí)的真知灼見(jiàn)直接傳遞給病人變得越來(lái)越重要。即便是在那些專(zhuān)家醫(yī)生充足的區(qū)域,這些醫(yī)生擔(dān)心他們的能力和努力無(wú)法及時(shí)且準(zhǔn)確地解釋那些浪潮一般的數(shù)據(jù),這些數(shù)據(jù)一般是從患者穿戴的傳感器或活動(dòng)追蹤設(shè)備中得到的,并且由患者自己驅(qū)動(dòng)。事實(shí)上,用數(shù)百萬(wàn)患者的數(shù)據(jù)訓(xùn)練得到的機(jī)器學(xué)習(xí)模型可以幫助專(zhuān)業(yè)醫(yī)護(hù)人士做出更好的決策。例如,護(hù)士可以承擔(dān)通常由醫(yī)生完成的醫(yī)療工作,初級(jí)護(hù)理醫(yī)生則可以承擔(dān)通常由醫(yī)療專(zhuān)家完成的工作,而醫(yī)療專(zhuān)家則可以將更多的時(shí)間投入到非常需要他們專(zhuān)業(yè)知識(shí)的病人身上。

不涉及機(jī)器學(xué)習(xí)的移動(dòng)應(yīng)用或網(wǎng)絡(luò)服務(wù)已被證明可以改善藥物的依賴(lài)性,還可以控制各種慢性病。但正式的回顧性和前瞻性評(píng)估方法阻礙了患者直接應(yīng)用機(jī)器學(xué)習(xí)。

主要挑戰(zhàn)

高質(zhì)量數(shù)據(jù)的可用性

構(gòu)建機(jī)器學(xué)習(xí)模型的核心挑戰(zhàn)在于組裝具有代表性的多樣化數(shù)據(jù)集。理想做法是在使用過(guò)程中利用最接近期望數(shù)據(jù)準(zhǔn)確格式和質(zhì)量的數(shù)據(jù)來(lái)訓(xùn)練模型。例如,對(duì)于打算用在即時(shí)護(hù)理中的模型而言,最好使用 EHR 在特定情況下所用的同一數(shù)據(jù),即便已知這些數(shù)據(jù)不可靠或這些數(shù)據(jù)受到了不必要變化的影響。當(dāng)數(shù)據(jù)集足夠大時(shí),現(xiàn)代模型可以成功被訓(xùn)練,以將嘈雜輸入映射到嘈雜輸出。使用人工篩查數(shù)據(jù)(比如那些在臨床試驗(yàn)中從人工病例審查得到的數(shù)據(jù))得到的更小數(shù)據(jù)集就不太理想,除非希望醫(yī)生根據(jù)原始實(shí)驗(yàn)規(guī)范手動(dòng)提取變量。這種做法對(duì)某些變量來(lái)說(shuō)或許可行,但對(duì)于做出最準(zhǔn)確預(yù)測(cè)所必需的、EHR 中數(shù)十萬(wàn)的數(shù)據(jù)而言就太不可行了。

俗話說(shuō)「垃圾進(jìn),垃圾出」(garbage in, garbage out),那么我們?nèi)绾螀f(xié)調(diào)噪聲數(shù)據(jù)集來(lái)訓(xùn)練模型呢?要學(xué)習(xí)大多數(shù)復(fù)雜的統(tǒng)計(jì)模式最好還是有大數(shù)據(jù)集(哪怕是噪聲數(shù)據(jù)),以便對(duì)模型進(jìn)行微調(diào)和評(píng)估,但具有人工篩查標(biāo)簽的更小樣例集還是有必要的。當(dāng)原始數(shù)據(jù)可能標(biāo)記錯(cuò)誤時(shí),這種樣例集可以就模型對(duì)預(yù)期標(biāo)簽的預(yù)測(cè)做出正確的評(píng)估。對(duì)成像模型來(lái)說(shuō),這通常需要生成由每張圖片的多個(gè)評(píng)分器判定的「ground truth」標(biāo)簽(即由一位絕對(duì)可靠的專(zhuān)家指定給一個(gè)樣例的診斷或發(fā)現(xiàn)),但對(duì)非成像任務(wù)來(lái)說(shuō),如果沒(méi)能獲得必要的診斷測(cè)試,那可能也無(wú)法獲得「ground truth」標(biāo)簽。

一般情況下,訓(xùn)練數(shù)據(jù)越多機(jī)器學(xué)習(xí)模型表現(xiàn)得越好。因此,對(duì)于機(jī)器學(xué)習(xí)的使用而言,一個(gè)關(guān)鍵的問(wèn)題是在利用大且多樣化數(shù)據(jù)集以提高機(jī)器學(xué)習(xí)模型準(zhǔn)確率的同時(shí),需要平衡隱私問(wèn)題和監(jiān)管要求。

從過(guò)去的失敗經(jīng)驗(yàn)中學(xué)習(xí)

人類(lèi)的所有活動(dòng)都會(huì)被意料之外的偏差破壞。機(jī)器學(xué)習(xí)系統(tǒng)的構(gòu)建者和使用者需要仔細(xì)考慮偏差如何影響用于訓(xùn)練模型的數(shù)據(jù),并采取措施解決和監(jiān)控這些偏差。

機(jī)器學(xué)習(xí)的優(yōu)勢(shì)(也是劣勢(shì)之一)在于模型可以識(shí)別到人類(lèi)無(wú)法找到的歷史數(shù)據(jù)模式。醫(yī)療實(shí)踐的歷史數(shù)據(jù)表明,人們能得到的系統(tǒng)性醫(yī)療護(hù)理是存在差異的,一般為弱勢(shì)群體提供的醫(yī)療護(hù)理較其他群體更差一些。在美國(guó),歷史數(shù)據(jù)反映了一種支付系統(tǒng),該系統(tǒng)會(huì)獎(jiǎng)勵(lì)使用不必要護(hù)理和服務(wù)的人,這樣可能會(huì)錯(cuò)過(guò)那些本該卻并未得到護(hù)理的病人(比如沒(méi)有保險(xiǎn)的患者)。

監(jiān)管、監(jiān)督和安全使用的專(zhuān)業(yè)知識(shí)

衛(wèi)生系統(tǒng)已經(jīng)建立了可以確保將藥物安全傳遞到患者手上的復(fù)雜機(jī)制。機(jī)器學(xué)習(xí)的廣泛適用性也需要同樣復(fù)雜的監(jiān)管結(jié)構(gòu)、法律框架以及當(dāng)?shù)貙?shí)踐以確保系統(tǒng)的安全開(kāi)發(fā)、使用和監(jiān)管。此外,技術(shù)公司必須要提供可擴(kuò)展的計(jì)算平臺(tái)來(lái)處理大量數(shù)據(jù)和模型使用的問(wèn)題,但到現(xiàn)在他們也不清楚自己的定位。

重要的是,使用機(jī)器學(xué)習(xí)系統(tǒng)的醫(yī)生和病人都需要理解其局限性,包括模型并不能泛化到特定場(chǎng)景。做決策或分析圖像時(shí)過(guò)度依賴(lài)機(jī)器學(xué)習(xí)模型可能會(huì)導(dǎo)致自動(dòng)化偏差,而醫(yī)生可能已經(jīng)降低其對(duì)這些偏差的警惕。如果模型的可解釋性不夠強(qiáng),醫(yī)生可能意識(shí)不到模型給出了錯(cuò)誤的建議,這時(shí)尤其會(huì)出現(xiàn)問(wèn)題。在模型預(yù)測(cè)中表現(xiàn)出置信區(qū)間可能有所幫助,但置信區(qū)間本身或許被錯(cuò)誤解釋。因此,需要對(duì)使用中的模型進(jìn)行前瞻性的、真實(shí)的臨床評(píng)估,而不只是根據(jù)歷史數(shù)據(jù)集對(duì)模型性能做回顧性評(píng)估。

需要特別考慮直接針對(duì)患者的機(jī)器學(xué)習(xí)應(yīng)用。患者可能無(wú)法驗(yàn)證模型構(gòu)建者所說(shuō)的話是否得到高質(zhì)量臨床證據(jù)的證實(shí),也無(wú)法驗(yàn)證模型建議的行為是否合理。

研究結(jié)果的出版與傳播

構(gòu)建模型的跨學(xué)科團(tuán)隊(duì)可能會(huì)在臨床醫(yī)生不熟悉的場(chǎng)所匯報(bào)結(jié)果。稿件通常會(huì)在 arXiv 和 bioRxiv 這樣的預(yù)印本服務(wù)網(wǎng)站上發(fā)布,許多模型的源代碼則會(huì)在 GitHub 庫(kù)這樣的地方保存。此外,許多同行評(píng)審的計(jì)算機(jī)科學(xué)稿件也并不會(huì)發(fā)布在傳統(tǒng)期刊上,而會(huì)發(fā)表在 NeurIPS(神經(jīng)信息處理系統(tǒng)大會(huì))和 ICML(國(guó)際機(jī)器學(xué)習(xí)大會(huì))這樣的會(huì)議上。

結(jié)論

大量衛(wèi)生保健數(shù)據(jù)的加速創(chuàng)建將從根本上改變醫(yī)療保健的性質(zhì)。我們堅(jiān)信,醫(yī)患關(guān)系將成為為患者提供醫(yī)療服務(wù)的基石,而這種關(guān)系會(huì)因機(jī)器學(xué)習(xí)的輔助而變得豐富。我們期望在未來(lái)幾年會(huì)出現(xiàn)一些早期模型和同行評(píng)審的刊物,它們的出現(xiàn)以及監(jiān)管框架和基于價(jià)值醫(yī)療的經(jīng)濟(jì)激勵(lì)的發(fā)展,都會(huì)成為對(duì)醫(yī)療領(lǐng)域應(yīng)用機(jī)器學(xué)習(xí)保持樂(lè)觀態(tài)度的理由。我們期望在不遠(yuǎn)的未來(lái),數(shù)百萬(wàn)臨床醫(yī)生在護(hù)理數(shù)十億患者時(shí),可以在機(jī)器學(xué)習(xí)模型的幫助下根據(jù)所有醫(yī)學(xué)相關(guān)數(shù)據(jù)做出決策,從而為所有患者提供最好的護(hù)理方案。(作者:機(jī)器之心)

<上一頁(yè)  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)