深陷在AI迷信里的醫(yī)療保健烏托邦
2017年12月,一個星期五的晚上,倫敦醫(yī)療應用開發(fā)商Babylon Health的創(chuàng)始人Ali Parsa,與自家的醫(yī)生坐下來進行了一次交流。這位出生于伊朗的前銀行家,依靠該公司的高評分應用,為Babylon融資了8500萬美元。這款應用可以讓英國患者快速與醫(yī)生進行視頻會診。在英國,國營醫(yī)療保健為每個公民提供了高質(zhì)量的醫(yī)療服務,但是卻要耗費很長時間等候門診。這款應用的出現(xiàn)改變了這一局面。
現(xiàn)在,Parsa希望通過添加一款人工智能聊天機器人,來進一步提高效率和降低成本。Parsa承諾,該聊天機器人可以在沒有人類互動的情況下,就常見疾病提供診斷建議。Babylon的應用用戶將于12月享受到這款全新機器人的服務。在未來某個時候,英國國家健康服務機構(gòu)(NHS)的患者也將享受到相應的服務。但問題是,根據(jù)這些醫(yī)生的交流,機器人給出的建議經(jīng)常是錯誤的。
據(jù)一名現(xiàn)任和前任工作人員稱,為了證明他們的觀點,醫(yī)生們花了大約一天時間,主動進行了一次審計。據(jù)一位知情人士稱,他們發(fā)現(xiàn),聊天機器人給出的100個最常見的結(jié)果中,約有10%至15%的結(jié)果,錯過了更嚴重疾病的警告信號,或者完全就是錯誤的。這些臨床醫(yī)生周五直接向Parsa進行了匯報,希望推遲新的發(fā)布。他們提出了自己的理由,經(jīng)過一番談判,他同意推遲發(fā)布。
但是醫(yī)生們?nèi)匀桓械嚼_。對現(xiàn)任和前任Babylon工作人員以及外部醫(yī)生的采訪顯示,他們普遍擔心該公司匆忙部署了未經(jīng)仔細審查的軟件,并夸大了其有效性。
根據(jù)一位外部醫(yī)生展示的電子郵件,2018年4月,一家英國廣告監(jiān)管機構(gòu)要求Babylon刪除其網(wǎng)站上的一項聲明,該聲明宣稱其分流功能能夠100%的給出安全建議。該機構(gòu)同時援引了一項關于這一聲明的“獨立研究”。但是根據(jù)Babylon自己在2016年發(fā)表的研究論文,這項研究來自一次內(nèi)部測試,在測試中,它雇傭了專業(yè)演員扮成病人,并按照劇本進行流程。
在那次周五會議后的六個月,Parsa在倫敦皇家醫(yī)學院舉行了一場盛大的直播活動,宣布Babylon的新軟件——人工智能驅(qū)動的聊天機器人——已經(jīng)達到了“全球醫(yī)療第一”的水平。Babylon展示了機器人在醫(yī)學檢查中的得分高于人類醫(yī)生的平均得分,并聲稱人工智能已經(jīng)達到了人類醫(yī)生的“同等準確度”。當時,多家媒體報道了這一成就。
布朗大學生物醫(yī)藥信息學教授Hamish Fraser表示,這一聲明是有問題的。他在英國主要醫(yī)學雜志《柳葉刀》最近的一篇文章中反駁了Babylon的聲明。他指出,Babylon的軟件只回答了50個檢查問題中的15個,并被允許對每個問題給出三個答案!爱斸t(yī)生做這個測試時,你會得到一個正確的答案,”他說。Babylon表示,它沒有試圖證明人工智能比醫(yī)生更好,Parsa也退出了這篇文章的預定采訪。
人工智能還沒有發(fā)展到可以替代(甚至可靠地協(xié)助)人類醫(yī)生的程度,這一點可能不足為奇。而傲慢的科技企業(yè)家對他們的產(chǎn)品進行過高的宣傳,也并不是什么新現(xiàn)象。這一切都不太重要,但是Babylon與英國國家醫(yī)療服務機構(gòu)簽訂了兩份合同。英國國家醫(yī)療服務機構(gòu)是世界上最大的國有醫(yī)療系統(tǒng)之一。Babylon的GP At Hand應用向3.5萬名NHS患者提供了視頻通話支持,并可以讓其訪問分流聊天機器人,以獲得是否就醫(yī)的建議。NHS還鼓勵200萬公民使用NHS 111: Online——一款由Babylon開發(fā)的應用,主要用來代替NHS咨詢熱線。工作人員表示,NHS還沒有使用Babylon的診斷建議聊天機器人,但該公司已經(jīng)討論過將這一功能引入NHS應用中。
NHS的動機很明確,也很簡單:它既想省錢,也想為病人帶來更好的健康結(jié)果。2020年,英國將在國家醫(yī)療系統(tǒng)上花費近2000億美元,相當于GDP的7%。自1950年以來,這一占比已經(jīng)翻了一番,因此英國迫切需要找到一種方法來控制成本,同時仍能提供被視為英國社會契約核心的福利。
減少急診室就診似乎是很合邏輯的,因為每次就診平均花費NHS 200美元。在過去的一年里,NHS為此總共花費了40億美元,而由于至少有150萬英國人在不需要的時候也會去急診室,導致候診時間不斷增加。如果Babylon的聊天機器人效果很好,將會對節(jié)省成本有很大的幫助。
但是,人們質(zhì)疑該軟件的有效程度。Babylon的一名工作人員稱,早期和當前版本的聊天機器人,在大約30%的情況下會建議用戶去急診室;相比之下,撥打國家健康咨詢熱線111的人大約只有20%。不清楚有多少病人接受了聊天機器人的建議,Babylon表示自己并沒有跟蹤這些數(shù)據(jù)。
即使在診斷建議聊天機器人最終被修復,并于2018年1月發(fā)布給Babylon私人應用用戶之后,一些Babylon醫(yī)生仍然對他們沒有看到開發(fā)過程中更嚴格的改革而感到擔憂。而在公司外部,發(fā)現(xiàn)的問題數(shù)量也越來越多。6月,一名正在Babylon應用上測試新診斷聊天機器人的英國醫(yī)生發(fā)現(xiàn)了一個錯誤:它錯過了一個肺栓塞的癥狀。他在Twitter上發(fā)布了一段視頻,并向醫(yī)療監(jiān)管機構(gòu)MHRA進行了投訴。根據(jù)該醫(yī)生分享的電子郵件和私人Twitter消息,這至少是他在過去一年半中第三次投訴聊天機器人軟件。據(jù)Babylon內(nèi)部消息來源稱,被MHRA記錄為事故的一些錯誤,直到2018年11月,仍然存在于內(nèi)置聊天機器人的健康應用上。MHRA以保密為由不予置評。
Babylon表示,MHRA要求其調(diào)查這些投訴,但“隨后沒有基于安全相關的理由展開正式調(diào)查”。當被問及MHRA記錄的錯誤時,Babylon堅持認為“任何臨床概率分析都不可能總是正確的”,并且“即使非常有經(jīng)驗的醫(yī)生有時也會錯誤地診斷”。
而在這一切正在發(fā)生的過程中,Babylon成功地將自己推銷為醫(yī)療系統(tǒng)過度擴張的數(shù)字藥膏。該公司最大的粉絲之一是英國衛(wèi)生部長Matt Hancock,他最近在一份由Babylon贊助的報紙副刊中宣稱,他“因使用這款GP at Hand應用而出名”。
Babylon應用的海報經(jīng)常出現(xiàn)在倫敦地鐵上。據(jù)Parsa稱,該公司正在預訂數(shù)千萬美元的收入,包括與NHS簽訂的GP at Hand合同(預計290萬美元)和NHS 111合作伙伴的收入。NHS England的發(fā)言人和Hancock沒有回應置評請求。
一名前工作人員表示,Babylon軟件的最大缺陷之一是缺乏真實的臨床評估和跟蹤。使用聊天機器人的人真的去過急診室嗎?如果他們看了醫(yī)生,那診斷是什么?一名前員工表示:“目前還沒有找到能夠提供答案的系統(tǒng)。”Babylon表示,其GP at Hand應用在用戶使用聊天機器人24小時后會向他們發(fā)送信息。據(jù)一名用戶稱,應用會詢問更多癥狀。
軟件是通過迭代開發(fā)的。開發(fā)人員構(gòu)建了一個應用并將其發(fā)布,在不同的實時用戶群體上測試它,并在前進的過程中不斷重復。這種硅谷心態(tài),曾經(jīng)被馬克·扎克伯格總結(jié)為“行動迅速,打破現(xiàn)狀”。但是開發(fā)新藥或醫(yī)療器械需要一種更慎重的方法,因為患者的生命是懸而未決的。Babylon尚未在同行評審的醫(yī)學雜志上發(fā)表任何研究成果,而這一過程往往也是需要時間的。
該公司的首席醫(yī)療官Mobasher Butt堅持認為,在市場上部署之前,Babylon“經(jīng)歷了臨床醫(yī)生對產(chǎn)品許多許多輪的嚴格測試!痹摴境姓J它沒有進行醫(yī)學研究,并稱未來進行醫(yī)院研究時,它會在醫(yī)學雜志上進行發(fā)表。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機大公開!