燒掉數(shù)百億美元,沃森醫(yī)生到底買來了什么教訓(xùn)?
2月18日,華爾街日?qǐng)?bào)傳出消息,國際商業(yè)機(jī)器公司(International Business Machines Corp.)正在思考如何幫助IBM脫手Watson Health。接下來,Watson可能被出售給私募股權(quán)公司、醫(yī)療行業(yè)企業(yè),或與一家特殊目的收購公司(SPAC)合并。行至此處,IBM實(shí)屬無奈。
簡述Watson Health的發(fā)展史,最早可追溯至2011年。那年,擁有一定自然語義分析能力的IBM 將醫(yī)療作為人工智能科研轉(zhuǎn)化的核心,開啟了Watson Health的漫漫旅程。整個(gè)AI的訓(xùn)練過程中,Watson先后師從紀(jì)念斯隆-凱特琳癌癥中心(MSK)、妙佑醫(yī)療國際(Mayo Clinic)、奎斯特診斷公司(Quest Diagnostics)等全球知名醫(yī)學(xué)研究機(jī)構(gòu)。放在國內(nèi),這稱得上是帝皇級(jí)的待遇。但直到故事結(jié)尾,Watson還是沒有成為一介名醫(yī)。
2017年與德克薩斯大學(xué)MD安德森腫瘤中心合作破裂是整個(gè)夢想幻滅的關(guān)鍵轉(zhuǎn)折:為了培養(yǎng)IBM想象中的虛擬醫(yī)生,MD中心全額支付了IBM 6210萬美元的研發(fā)費(fèi)用,待海量資金燒盡之后,Watson仍然無法有效應(yīng)用于臨床,而本已存在資金問題的MD中心更是深陷財(cái)務(wù)泥沼。
至那以后,受挫Watson便啟動(dòng)了多次大規(guī)模裁員,在衰落的道路上一去不復(fù)返。今日再談起Watson,國內(nèi)一名涉足于此的經(jīng)銷商不愿多言,只是透露道:“這兒的每個(gè)人都認(rèn)為,這是一個(gè)失敗的產(chǎn)品!
從舉世矚目到黯然消亡,Watson生存于醫(yī)療領(lǐng)域的十年是醫(yī)療AI發(fā)展的縮影。燒掉數(shù)百億美元,Watson到底為我們買來了怎樣的教訓(xùn)?
十年耕耘,Watson到底做出了什么?
回到Watson進(jìn)入醫(yī)療領(lǐng)域那一年,當(dāng)IBM 為其立下遠(yuǎn)大前程后,它接觸的第一個(gè)老師便是大名鼎鼎的紀(jì)念斯隆-凱特琳癌癥中心。老師的專業(yè)決定了學(xué)生的能力,以腫瘤治療著稱的MSK自然主導(dǎo)了Watson的風(fēng)格;加之IBM自身轉(zhuǎn)變?yōu)椤罢J(rèn)知解決方案云平臺(tái)公司”,Watson被要求成為一名“用下一代 AI認(rèn)知技術(shù)應(yīng)用于癌癥治療”的虛擬醫(yī)生。
順著這一圖景,IBM Watson Health先后開發(fā)了三個(gè)獨(dú)特的癌癥治療解決方案,輔助全球各地的醫(yī)生對(duì)患者進(jìn)行診治,分別是Watson腫瘤解決方案(Watson for Oncolgy);Watson臨床實(shí)驗(yàn)匹配解決方案(Watson for Clinical Trial Matching)與Watson基因解決方案(Watson for Genomics)
三個(gè)方案名字諱莫如深,但內(nèi)容理解起來很簡單。第一個(gè)Watson for Oncology是IBM賣得最好的產(chǎn)品,意在為患者提供多種治療方案,并可擴(kuò)充腫瘤專家自身的專業(yè)知識(shí);第二個(gè)Watson for Clinical Trial Matching 用于幫助藥物臨床試驗(yàn)尋求合適的患者;第三個(gè)Watson for Genomics 則是用基因測序技術(shù),對(duì)腫瘤進(jìn)行精準(zhǔn)治療。
IBM對(duì)于AI的洞察力毋庸置疑,即便放在今天,這三個(gè)目標(biāo)仍然是AI應(yīng)用的主要方向,也依然極具挑戰(zhàn)。因此,問題還是出在產(chǎn)品本身。
AI之內(nèi):有限的市場與缺失的邏輯
先談最為重要的Watson for Oncology,這是一個(gè)類似于單病種CDSS的產(chǎn)品,意在給定患者文本及影像信息,結(jié)合Watson已經(jīng)學(xué)會(huì)的知識(shí)(包括乳腺癌、肺癌、直腸癌等13個(gè)癌種)進(jìn)行多輪判斷,最終輸出結(jié)果,其具體處理邏輯如下。
在實(shí)際之中,Watson的診斷流程大致可分為四步,分別是:
1. 輸入醫(yī)療記錄,將患者多個(gè)時(shí)間節(jié)點(diǎn)的診斷數(shù)據(jù)輸入系統(tǒng),包括結(jié)構(gòu)化數(shù)據(jù)(電子病歷等)和非結(jié)構(gòu)化數(shù)據(jù)(影像等);
2.分析醫(yī)療數(shù)據(jù),檢索已有知識(shí)圖譜,并對(duì)輸入的醫(yī)療數(shù)據(jù)進(jìn)行查找與分析,最終為每一位患者提供多種可能有效的治療方案;
3. 方案排序,按照可信度指標(biāo)為各種治療方案排序。
4. 輸出結(jié)果,最終患者拿到手的,是一本內(nèi)容豐富的癌癥治療方案建議報(bào)告。其中,包括幾種推薦方案、考慮方案和不推薦方案,并注明采用此方案的生存率、不良反應(yīng)發(fā)生率、藥物相互作用這些相關(guān)信息,幫助醫(yī)生、患者了解該方案的療效與風(fēng)險(xiǎn)。
Watson通過不斷調(diào)整其內(nèi)部處理程序來“學(xué)習(xí)”,以便在某些問題上得到高概率的正確答案,例如放射圖像揭示癌癥。正確的答案必須是已知的,這樣系統(tǒng)才能被告知,何時(shí)做對(duì)了什么,何時(shí)做錯(cuò)了什么。系統(tǒng)能夠處理的訓(xùn)練問題越多,命中率就越高。
但是,假若數(shù)據(jù)本身具有一定問題,Watson基于問題知識(shí)的診斷自然也會(huì)存在問題。
對(duì)于依賴于知識(shí)圖譜的AI而言,知識(shí)的廣度與準(zhǔn)確度決定的AI本身判斷的精準(zhǔn)程度,但若沒有對(duì)知識(shí)進(jìn)行充分描述,訓(xùn)練出的AI便會(huì)出問題。舉個(gè)例子,如果知識(shí)A告訴Watson長時(shí)間住院容易產(chǎn)生深靜脈血栓,知識(shí)B告訴Watson住院不是產(chǎn)品深靜脈血栓的根本原因,人能夠很容易分清兩句話的邏輯,但AI不行。此類具有邏輯矛盾的描述一旦多了起來,AI輔助診斷的準(zhǔn)確率便會(huì)下降。
另一種問題來源于數(shù)據(jù)本身的錯(cuò)誤。如果我們發(fā)現(xiàn)一個(gè)患者的診斷結(jié)論為卵巢癌,而患者性別為男,還會(huì)用這個(gè)數(shù)據(jù)做進(jìn)一步的臨床研究嗎?如果我們發(fā)現(xiàn)病理報(bào)告匯總中當(dāng)天來檢查的二十多個(gè)患者的生日全部是同一天,這得是多么大的“緣分”?在所有的NLP技術(shù)模型構(gòu)建之前,必須要解決這些與正常的醫(yī)學(xué)邏輯、常識(shí)邏輯相違背的問題 。
第三個(gè)問題是缺乏尋找隱藏在已有數(shù)據(jù)外的知識(shí)的能力,舉個(gè)例子,在患者的“一述五史”中,研究人員需要提取一個(gè)字段名稱叫做“是否有吸煙史”,因此他們需要標(biāo)注的結(jié)論是“是”或者“否”,而這兩個(gè)字在病歷中是不直接出現(xiàn)的,那就需要拆解邏輯,要明確從病例中識(shí)別出什么,最終判斷這個(gè)是否吸煙的結(jié)論。
Watson對(duì)于上述三個(gè)問題并沒有給出很好的解決答案。相反,IBM耗費(fèi)40億巨資收購了Explorys、Phytel、Merge Healthcare等數(shù)據(jù)公司,合作多個(gè)著名醫(yī)療機(jī)構(gòu)……重重努力有力擴(kuò)充了Watson的知識(shí)量,卻沒有有效提升Watson的邏輯能力。
此外,Watson的根“數(shù)據(jù)”出于MSK。雖然IBM意在全球,但是MSK的診斷風(fēng)格或許不能適用于每一區(qū)域。以中國為例,生活、飲食習(xí)慣乃至基因差異決定了診斷的差異,本土化不足的Watson很難適應(yīng)這樣的變化,給出準(zhǔn)確的診斷結(jié)果。
不僅如此,從Watson的推理過程看來,其分析過程需要結(jié)合結(jié)構(gòu)化的病歷數(shù)據(jù)與非結(jié)構(gòu)化的影像數(shù)據(jù),需要AI處理異構(gòu)數(shù)據(jù)。這在國內(nèi)一般被分為AI的兩個(gè)階段,每個(gè)階段均有各自的AI負(fù)責(zé)運(yùn)算,Watson有些操之過急。因此,即便擁有影像AI公司Merge Healthcare的助力,至少在國內(nèi)的醫(yī)生看來,Watson沒有交出一張好的成績表,只能在診斷中給出標(biāo)準(zhǔn)的、醫(yī)生能力范圍內(nèi)的建議。
不過,盡管缺乏有效的AI邏輯、缺乏自動(dòng)化的數(shù)據(jù)質(zhì)量問題發(fā)現(xiàn)算法,Watson的知識(shí)圖譜仍具備很高的價(jià)值。Watson顯然看到了這一點(diǎn),用于幫助藥物臨床試驗(yàn)尋求合適患者的Watson for Clinical Trial Matching 與用基因測序技術(shù)對(duì)腫瘤進(jìn)行精準(zhǔn)治療Watson for Genomics便是Watson價(jià)值的證明。
相對(duì)于偏向醫(yī)生端的輔助診斷,這兩個(gè)產(chǎn)品對(duì)邏輯推理的要求較低,更注重文獻(xiàn)、數(shù)據(jù)的豐富程度,Watson完全能夠滿足這樣的條件。但問題也在于此,如果條件太低,企業(yè)便無法構(gòu)建充分的競爭力。這里的問題在于市場有限,且數(shù)據(jù)庫是醫(yī)療大數(shù)據(jù)公司的基礎(chǔ),競爭對(duì)手眾多。國內(nèi)的HLT、浪潮健康都有提供與Watson for Clinical Trial Matching一致的業(yè)務(wù),而Watson for Genomics所處的市場則對(duì)AI要求不高,位于上游的測序機(jī)構(gòu)更具備話語權(quán)。
AI之外:過度的包裝與存疑的商業(yè)模式
過度的包裝導(dǎo)致醫(yī)療AI常常被人詬病,在這一方面,Watson算是開了一個(gè)糟糕的開頭。從2011年美國智力競猜節(jié)目《危險(xiǎn)邊緣》中擊敗兩位歷史上最優(yōu)秀的選手后,IBM放出了“人類將會(huì)被取代”的豪言,乃至到了2019年,還有不少醫(yī)療人工智能企業(yè)家,仍在強(qiáng)調(diào)自己做的AI,“不是要取代醫(yī)生,而是要賦能醫(yī)生”。
這個(gè)錯(cuò)誤包含兩方面的問題,一是給了投資人、醫(yī)生乃至醫(yī)院過高的期待,加大了產(chǎn)品存在缺陷時(shí)采購者的心理落差;二是產(chǎn)品沒有遵循“以人為本”的設(shè)計(jì)理念,難以進(jìn)入實(shí)際臨床流程,不能實(shí)際為醫(yī)生減壓賦能。
其次是營收問題。根據(jù)本次華爾街日?qǐng)?bào)給出的數(shù)據(jù),Watson年?duì)I收為10億美元,這一數(shù)字多少有些奪人眼球。
我們不妨借用2019年數(shù)據(jù)簡單計(jì)算一下。目前醫(yī)療AI 頭部創(chuàng)業(yè)公司的營業(yè)收入在一個(gè)億人民幣左右,AI獨(dú)角獸云知聲年收入2.19億元,依圖科技年收入7.17億元,衛(wèi)寧健康營收19億元……眾多公司加起來才能湊夠IBM Watson Health全球65億元的營收。
再看一組數(shù)據(jù),《華爾街日?qǐng)?bào)》曾透露,Watson Health產(chǎn)品組合中最大的AI產(chǎn)品是Watson for Oncology,IBM通常向每位患者收費(fèi)200至1000美元,在某些情況下還需要咨詢費(fèi);據(jù)《數(shù)智物語》報(bào)道,2017年百洋醫(yī)藥集團(tuán)董事長付鋼在接受記者采訪時(shí)曾表示,使用Watson腫瘤解決方案均自費(fèi),價(jià)格是4500元/例。而IBM給出的數(shù)據(jù)是,至2018年6月底,使用Watson for Oncology的患者數(shù)量為84000名,以20%的患者增長率計(jì)算,Watson for Oncology的患者端大概能夠?yàn)镮BM帶來5.5億元的總共收入,遠(yuǎn)低于每年10億美元這一數(shù)字。
2018年11月,處于衰退狀態(tài)的Watson在國內(nèi)的落地情況是43個(gè)城市近80家醫(yī)院,略低于頭部AI公司,按照這一數(shù)字計(jì)算,Watson帶來的收入距離其百億級(jí)的投入,還有很長距離。
還有一個(gè)問題不容忽視:為什么患者會(huì)想要一個(gè)昂貴的虛擬醫(yī)生,而非平價(jià)的主任醫(yī)生進(jìn)行診斷呢?
百億美金燒出了什么教訓(xùn)?
內(nèi)外之下,我們大致可以將Watson存在的問題歸納于4點(diǎn)。
一、在大規(guī)模的收購過程中,Watson的人員嚴(yán)重冗雜。在MSK事件后,Watson事業(yè)部裁員50%至70%,被裁員工主要來自收購的三家公司Phytel、Explorys和Truven。
二、診斷準(zhǔn)確性、安全性存疑。2018年,IBM內(nèi)部文件流出,多個(gè)案例均暗示W(wǎng)atson Health缺乏準(zhǔn)確與安全。實(shí)際上,綿綿十年,Watson也沒有通過FDA的審批,IBM也未發(fā)表任何科學(xué)論文,證明該技術(shù)如何影響醫(yī)生和患者。
三、數(shù)據(jù)集存在問題。數(shù)據(jù)集存在認(rèn)知偏見,缺乏有效的邏輯推理,缺乏質(zhì)控、缺乏本土化優(yōu)化。
四、虛擬診斷為偽需求,“燒錢的醫(yī)生”不掙錢。
如今戰(zhàn)略轉(zhuǎn)向AI與混合云,IBM拋棄Watson這一棋子已成為必然。但是,Watson的沒落并非AI的沒落,起伏十年,我們能從中看到許多有價(jià)值的東西。
首先是對(duì)于AI的定義。習(xí)慣了“互聯(lián)網(wǎng)+”的我們常常用“AI+”來定義其醫(yī)療應(yīng)用,但互聯(lián)網(wǎng)本身便是一個(gè)場景,而目前的AI,僅是某一醫(yī)療場景中的某一應(yīng)用,是服務(wù)于該場景的技術(shù),更為準(zhǔn)確的說法為“+AI”。換句話說,我們應(yīng)該根據(jù)具體的醫(yī)療場景定制需求,而非做好一個(gè)AI算法,強(qiáng)行將其置于某一AI流程之中。
這樣的好處顯而易見。從信息化的產(chǎn)業(yè)發(fā)展可知,醫(yī)療需要AI,但又沒有那么需要AI。從現(xiàn)在的信息化政策來看,各類評(píng)級(jí)強(qiáng)調(diào)了數(shù)據(jù)的收集、整理、清洗、上報(bào)、分析、質(zhì)控,很多過程依靠人力難以實(shí)現(xiàn)(尤其是分析、質(zhì)控),必須利用基于NLP的知識(shí)圖譜的數(shù)據(jù)進(jìn)行處理。這些領(lǐng)域之中,我們通常不談AI,但AI卻已成為新一代信息系統(tǒng)不可或缺的一部分。
再談知識(shí)圖譜。大規(guī)模臨床電子病歷要真的發(fā)揮其價(jià)值并不能如Watson一樣進(jìn)行簡單的堆疊許欸小,而是需要解決很多問題。在這之中,數(shù)據(jù)質(zhì)量治理問題、數(shù)據(jù)結(jié)構(gòu)化信息提取問題、數(shù)據(jù)歸一標(biāo)準(zhǔn)化問題都非常難以處理。這些問題的解決單純靠人工是無法規(guī);,必須用自然語言處理技術(shù)作為支撐。這里不僅需要自然語言處理的算法技術(shù)、計(jì)算技巧和工程能力,更需要很強(qiáng)的醫(yī)學(xué)背景知識(shí)。因此,要實(shí)現(xiàn)有效的診斷,必須一一解決上述問題,構(gòu)造出有效的邏輯。
作者:趙泓維

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
技術(shù)文庫
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢,以Edge AI驅(qū)動(dòng)機(jī)器視覺升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測量
-
10 “意外”的藥明康德
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯(cuò)估了關(guān)稅將對(duì)中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進(jìn)出口報(bào)告:前十大出口市場在哪?
- 4 認(rèn)購火爆,映恩生物打響18A IPO重啟信號(hào)槍
- 5 中國創(chuàng)新藥出海:機(jī)遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺(tái)!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上!半[形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級(jí)公司
- 10 外骨骼機(jī)器人,誰是盈利最強(qiáng)企業(yè)?