對話翼方健數(shù)羅震:天下無難用的數(shù)據(jù),如何讓“機器人醫(yī)生”更智能?
除了安全計算之外,羅震在數(shù)據(jù)透明、差分隱私、云計算等做了詳細(xì)闡釋。
比如說常見的數(shù)據(jù)透明,對于平臺數(shù)據(jù)內(nèi)個人的信息脫敏處理,但是無法解決所有問題。因為在大數(shù)據(jù)的年代,當(dāng)你對數(shù)據(jù)主體的理解足夠多,甚至可以通過對其日常生活的了解,到平臺找到這個人。
如何解決隱私保護(hù)問題,差分隱私是一套非常好的量化隱私保護(hù)的解決方案。這套理論體系內(nèi),我們將每一個查詢中間的隱私法用量化的方式表達(dá)?梢栽谶^程中比較精準(zhǔn)的衡量平臺用戶做了career后,有多大的可能性定位到他想找的每一個人。平臺可以通過一些加噪音的方法或限制的手段來防礙它。
此外,當(dāng)我們在大數(shù)據(jù)的平臺內(nèi)做不同的計算,在很多底層技術(shù)使用等方面與云計算、區(qū)塊鏈有很大關(guān)系。數(shù)據(jù)不出平臺,當(dāng)數(shù)據(jù)在內(nèi)部會發(fā)生變化、計算產(chǎn)生新的結(jié)果過程中,可以利用區(qū)塊鏈完整的記錄數(shù)據(jù)演化的過程。
3
讓天下沒有難用的數(shù)據(jù)
這些問題我們認(rèn)為是在隱私計算中可以考慮到極具挑戰(zhàn)性且很有意思的技術(shù)問題。羅震認(rèn)為隱私計算的技術(shù)范疇非常廣泛,我們公司最主要想做的事情是想讓大家把數(shù)據(jù)利用起來。
所以提出的口號是我們努力成為“數(shù)據(jù)和算法互聯(lián)網(wǎng)”的推動者,建立一個由安全數(shù)據(jù)和計算(特別是AI應(yīng)用);數(shù)據(jù)所有者、數(shù)據(jù)用戶和服務(wù)提供商所組成的活躍生態(tài)系統(tǒng)。
Step1, 建立獨立的隱私安全生態(tài),將數(shù)據(jù)所有者的數(shù)據(jù)利用起來。如我們和地方衛(wèi)計委合作,將來自于醫(yī)院、婦幼保健、基層衛(wèi)生等不同來源的數(shù)據(jù),進(jìn)行加工治理。
羅震列舉團(tuán)隊在廈門做的落地案例。廈門17年是國家健康醫(yī)療大數(shù)據(jù)首批試點的4個城市之一。衛(wèi)計委當(dāng)時想把廈門的存量醫(yī)療數(shù)據(jù)開放出來,過程中,我們與廈門市衛(wèi)計委搭建開放的應(yīng)用生態(tài),如今平臺內(nèi)已有大量的科研機構(gòu)利用數(shù)據(jù)。
舉例來說,廈門大學(xué)國家醫(yī)療健康研究院為新生兒重癥病的人群,找到他們媽媽在懷孕期間的產(chǎn)檢記錄,和NIPT的數(shù)據(jù)結(jié)合做關(guān)聯(lián)性的研究。這些事情在平臺內(nèi)完成,而全部做到需要多維度的數(shù)據(jù)。所以在平臺中,如果把所有的數(shù)據(jù)都打通,就能夠支持高質(zhì)量的應(yīng)用。我們將一些非結(jié)構(gòu)化的醫(yī)療文本結(jié)構(gòu)化,把中間結(jié)構(gòu)化的信息提取出來,根據(jù)結(jié)構(gòu)化的信息,結(jié)合一些診斷診療、檢查檢驗的數(shù)據(jù),然后用醫(yī)生的實際診斷進(jìn)行訓(xùn)練,可以產(chǎn)生類似像機器人醫(yī)生的工具。
機器人醫(yī)生的水平受幾個因素的影響,一是老師的水平,二是學(xué)生的學(xué)習(xí)能力,三是最終機器人醫(yī)生的水平。
舉一個具體的例子,在一家醫(yī)院內(nèi)用他自己的數(shù)據(jù)訓(xùn)練出的模型做一個具體的應(yīng)用,觀察這家醫(yī)院醫(yī)生診療過程中整體以及個體表現(xiàn)。我們發(fā)現(xiàn)在模型訓(xùn)練的時候,以肺炎和支氣管肺炎為例,它的 Top 1的符合率比較低,但是Top3符合率比較高,背后的原因是某院肺炎和支氣管肺炎診斷經(jīng);煊,所以造成符合率不高。
我們整體的思路是,首先幫助有數(shù)據(jù)的人將數(shù)據(jù)治理好,通過隱私安全計算方式,在中間通過他的數(shù)據(jù)產(chǎn)生AI并且把AI通過一種能力的方式輸出,改造現(xiàn)有的醫(yī)療信息系統(tǒng),為醫(yī)療信息系統(tǒng)裝上智慧的腦袋。
Step2,羅震介紹團(tuán)隊通過計算連接隱私安全計算平臺,進(jìn)一步發(fā)掘數(shù)據(jù)價值。
具體落地方面,在中國一些不同的城市中,我們先使用醫(yī)療數(shù)據(jù),而后將它們相互連接起來。期間我們進(jìn)行智能應(yīng)用部署、將數(shù)據(jù)產(chǎn)生智能服務(wù)為醫(yī)院質(zhì)控,并將部署點與應(yīng)用命名。另一方面與比如與第三方數(shù)據(jù)源合作,有地理位置信息數(shù)據(jù)的,做智能營銷方面工作。
總結(jié)而言,形成中的數(shù)據(jù)和計算互聯(lián)網(wǎng)(IoDC)。很多時候需要這樣的信息幫助我們發(fā)現(xiàn)疾控中間的一些新發(fā)的創(chuàng)業(yè)熱點,通過有機的計算和數(shù)據(jù)的建設(shè)、網(wǎng)絡(luò)的建設(shè),最終實現(xiàn)將各個點連起來,實質(zhì)是開放的生態(tài)。
所以我們現(xiàn)在和比如像微眾銀行、螞蟻鏈做合作,在區(qū)塊鏈上采用大量第三方技術(shù),同時我們熱切期盼更多生態(tài)合作伙伴一道加入,充分挖掘數(shù)據(jù)價值。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?