訂閱
糾錯
加入自媒體

探索隱私計算的江湖:數(shù)據(jù)金礦的守護者與吹哨人

煤老板和IT精英相遇,兩個人想比比誰更富有,但都不愿告訴對方自己真正擁有多少財富,也不想讓第三方掌握原始信息。何解?

以上是圖靈獎得主姚期智院士提出的“百萬富翁假設(shè)”的通俗版演繹,里面涉及大數(shù)據(jù)發(fā)展進程中的一個核心難題:如何厘清數(shù)據(jù)的所有權(quán)和使用權(quán)。在我們?nèi)粘5膽?yīng)用場景中,數(shù)據(jù)的所有權(quán)和使用權(quán)經(jīng)常是混合在一起的,難免會遭遇顧此失彼的窘境。想象一種神奇的分離術(shù):煤老板和IT精英擁有自身財富數(shù)據(jù)的所有權(quán),平臺只能獲得加密數(shù)據(jù)的使用權(quán),而經(jīng)過“黑盒”的轉(zhuǎn)化,即可得出“誰更富有”的結(jié)論。這就是隱私計算的雛形,專業(yè)表述為“解決互不信任的參與方之間,在保護隱私信息以及沒有可信第三方前提下的協(xié)同計算問題”。在數(shù)據(jù)大爆發(fā)的浪潮下,隱私計算的發(fā)展一日千里。4月18日在北京舉辦的騰訊大數(shù)據(jù)高峰論壇上,第四代數(shù)智融合計算平臺“騰訊大數(shù)據(jù)-天工”橫空出世,《騰訊隱私計算白皮書》也新鮮出爐(可以在微信公眾號后臺輸入“隱私計算”下載這份白皮書)。行業(yè)龍頭的重磅出擊,標志著隱私計算在國內(nèi)大數(shù)據(jù)領(lǐng)域已漸入佳境,實踐模式和方法論體系日趨成型。

失控的隱私與沉睡的金礦在隱私計算大行其道之前,國內(nèi)大數(shù)據(jù)領(lǐng)域的局面是:海量數(shù)據(jù)洪水滔天,應(yīng)用落地泥沙俱下。一方面,用戶數(shù)據(jù)隱私泄露問題頻繁發(fā)生。網(wǎng)紅奶茶店無死角攝像頭收集顧客人臉信息,線上交易平臺幾元錢就能買上千張人臉照片,如果身份信息也失守,用戶很有可能成為詐騙、洗錢、涉黑等違法犯罪的犧牲品。另一方面,有效、合規(guī)的數(shù)據(jù)資源非常稀缺,合法的數(shù)據(jù)交易與深度的數(shù)據(jù)挖掘愈發(fā)困難。數(shù)據(jù)已被定性為土地、勞動力、資本、技術(shù)之外的第五大生產(chǎn)要素,也成為企業(yè)和平臺最重要的核心資產(chǎn)。如果不能對數(shù)據(jù)進行充分的保護和合規(guī)的使用,就等于讓一座價值連城的金礦徹底沉睡。先從法律上劃定底線,也許是打破混沌格局的首要之策。

我國不久前審議的《個人信息保護法草案》規(guī)定:侵害個人信息權(quán)益的違法行為,情節(jié)嚴重的沒收違法所得,并處5000萬元以下或上一年度營業(yè)額5%以下罰款——5%的額度甚至超過了有“最嚴數(shù)據(jù)保護”之稱的歐盟GDPR。真正的長效解決方案,還得寄希望于隱私計算的持續(xù)推廣。根據(jù)國際知名調(diào)研機構(gòu)Gartner的分析和預(yù)測:隱私計算將成為2021年企業(yè)重點關(guān)注的9項技術(shù)之一;到2025年,將有50%的企業(yè)使用隱私計算挖掘數(shù)據(jù)價值。

破解的路徑與有益的探索在隱私計算的江湖上,主要有三大技術(shù)流派:一是以多方安全計算(MPC)為代表,采用密碼學(xué)方案,以秘密分享(Secret Sharing)、不經(jīng)意傳輸、混淆電路等專業(yè)技術(shù)實現(xiàn)通用性和性能提升。二是以可信執(zhí)行環(huán)境(TEE)為主,構(gòu)建硬件安全區(qū)域,數(shù)據(jù)僅在該區(qū)域內(nèi)進行計算,在非嚴苛場景下可發(fā)揮重要價值。三是分布式機器學(xué)習(xí)技術(shù)和系統(tǒng)——聯(lián)邦學(xué)習(xí),其通過同態(tài)加密、差分隱私等方式提高數(shù)據(jù)協(xié)作過程中的安全性。三大流派交織演進,相互融合,再加上防篡改、可追溯的區(qū)塊鏈技術(shù)加持,通用型隱私計算超級平臺的誕生似乎并不遙遠。

時代的吹哨人與開礦的先行者在隱私計算平臺的競爭中,“騰訊大數(shù)據(jù)-天工”無疑是其中的佼佼者。自2009年迄今,騰訊大數(shù)據(jù)平臺歷經(jīng)四代更迭:第一代大數(shù)據(jù)平臺依托Hadoop生態(tài),圍繞離線計算模式化構(gòu)建出能夠穩(wěn)定支撐小時/天級別的計算任務(wù)數(shù)據(jù)處理平臺;2012年前后,第二代大數(shù)據(jù)平臺通過引入Spark、Storm等實時計算處理框架,讓處理性能邁入毫秒級別;2015年,第三代大數(shù)據(jù)平臺朝著機器學(xué)習(xí)方向發(fā)展,其自研機器學(xué)習(xí)框架Angel成為國內(nèi)第一個從Linux基金會畢業(yè)的AI項目;從2020年開始著手規(guī)劃的第四代數(shù)智融合計算平臺“騰訊大數(shù)據(jù)-天工”,以“數(shù)據(jù)協(xié)同、技術(shù)互通、平臺大腦”技術(shù)理念為基礎(chǔ),未來將在確保數(shù)據(jù)安全的前提下,推動萬億級數(shù)據(jù)分析逐步實現(xiàn)“自動駕駛”。

騰訊數(shù)據(jù)平臺部總經(jīng)理蔣杰在2012年剛加盟騰訊時,曾對其負責的業(yè)務(wù)領(lǐng)域做了一番“摸底考察”。作為一位已跟數(shù)據(jù)打了十年交道、對技術(shù)趨勢高度敏感的專家,他當時的結(jié)論是:“騰訊大數(shù)據(jù)團隊可能落后領(lǐng)先水準三年左右”。如今站在聚光燈下,蔣杰顯然有更多的底氣。2020年,騰訊大數(shù)據(jù)團隊憑借3072bit業(yè)界最高強度加密和TEE硬件雙保險技術(shù),獲得了iDash 世界隱私計算大賽冠軍。這顆皇冠上的明珠,凝結(jié)著幾代工程師的心血。

“騰訊大數(shù)據(jù)-天工”在隱私計算領(lǐng)域并非單點突破,而是整體推進。借助自研技術(shù),從機器學(xué)習(xí)到大數(shù)據(jù)分析,第四代數(shù)智融合平臺可以為各個應(yīng)用場景提供全面保護,去中心化的架構(gòu)則能避免隱私泄露風險。作為第四代數(shù)智融合計算平臺的重要組成部分,騰訊Angel PowerFL安全聯(lián)合計算平臺也頗受矚目。Angel PowerFL擁有全棧的聯(lián)邦機器學(xué)習(xí)和深度學(xué)習(xí)功能,可以提供多種隱私保護機制,在不同的應(yīng)用場景里為用戶提供差異化的安全保護級別。

在跨機構(gòu)的隱私計算場景里,跨公網(wǎng)通信是隱私計算系統(tǒng)的瓶頸。為了解決這一問題,Angel PowerFL平臺采用消息隊列(MQ)作為通信通道,借助MQ模塊的擁塞控制和消息持久化功能,可以進一步增強系統(tǒng)穩(wěn)定性。在MQ的基礎(chǔ)上,騰訊還采用了高效的消息壓縮算法來減少通信開銷,提高多方交互效率。作為騰訊云數(shù)據(jù)安全網(wǎng)絡(luò)(DSN)底層引擎,Angel PowerFL堪稱金融級安全強度的隱私計算平臺,在智慧醫(yī)療、金融風控、數(shù)字政務(wù)、推薦廣告等領(lǐng)域已贏得眾多客戶的認可——在騰訊大數(shù)據(jù)高峰論壇上,來自民生銀行、中國電信、中國電力科學(xué)研究院等跨行業(yè)的生態(tài)伙伴齊聚一堂,即是明證。

終極目標與未竟挑戰(zhàn)在《騰訊隱私計算白皮書》的封面上,標題中的“數(shù)據(jù)向善”尤為搶眼。這是騰訊“科技向善”理念的延伸,也是隱私計算發(fā)展的終極目標。遠大前程并非一蹴而就。數(shù)據(jù)合規(guī)是隱私計算一直致力于解決的行業(yè)痛點,從實際運作來看,還有不小的提升空間。例如,作為底層邏輯的用戶授權(quán)同意機制,隱私計算的參與方不應(yīng)以對外公開的是數(shù)據(jù)模型而非原始數(shù)據(jù)為由,規(guī)避協(xié)作環(huán)節(jié)的用戶授權(quán),在本地服務(wù)器中建模的行為,也需要進一步規(guī)范。化解數(shù)據(jù)安全的衍生風險亦無止境。以聯(lián)邦學(xué)習(xí)為例:盡管其無需參與者直接共享原始數(shù)據(jù),但模型更新仍然有可能泄露參與者訓(xùn)練數(shù)據(jù)的相關(guān)信息,攻擊者可以采用推理判斷具體的數(shù)據(jù)點或數(shù)據(jù)屬性是否被用于訓(xùn)練,或采用逆向?qū)W習(xí)的方法還原原始數(shù)據(jù)。這就要求企業(yè)在模型、輸入、訓(xùn)練數(shù)據(jù)、輸出等維度建立更全面的隱私計算屏障。此外,隱私計算參與各方權(quán)利義務(wù)的邊界尚待進一步明確。

通常而言,隱私計算涉及的主體包括個人信息主體、數(shù)據(jù)持有方、計算方和結(jié)果方。目前各方之間的法律關(guān)系還有模糊地帶,數(shù)據(jù)挖掘的商業(yè)行為務(wù)求謹慎,防止出現(xiàn)超常規(guī)的高風險作業(yè)。凡心兩扇門,善惡一念間。技術(shù)本身是中性的,去中心化的平臺對各方都是敞開的,隱私計算向善路徑的鋪就,離不開劣幣懲戒機制的運行和良性生態(tài)的構(gòu)建。陽光普照,雨露滋潤,“天工”才能“開物”。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號