《電子技術應用》
您所在的位置:首頁 > 通信与网络 > 业界动态 > 大数据经济浪潮扑面而来,数据共享与隐私到底能不能共存?

大数据经济浪潮扑面而来,数据共享与隐私到底能不能共存?

2019-06-27

  大數(shù)據(jù)經(jīng)濟浪潮已撲面而來。

  幾十年來,全球IT行業(yè)遵循著摩爾定律所預測的速度發(fā)展著,直到現(xiàn)在,這一定律依然發(fā)揮著效用。當5G、云計算、物聯(lián)網(wǎng)等技術越來越成熟,海量數(shù)據(jù)的生產(chǎn)、采集、存儲和處理成為了現(xiàn)實,智能化時代來臨,數(shù)據(jù)潛力也得到了空前釋放。

  據(jù)國際數(shù)據(jù)公司和希捷公司的報告顯示,2020年中國數(shù)據(jù)總量將會超過8萬億GB,占全球數(shù)據(jù)總量達20%左右,中國將成為數(shù)據(jù)生產(chǎn)量最大、類型最豐富的國家。

  數(shù)據(jù)量爆發(fā),依托數(shù)據(jù)的產(chǎn)業(yè)經(jīng)濟規(guī)模也會空前擴大。據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布報告顯示,預測在2020年我國大數(shù)據(jù)產(chǎn)業(yè)市場規(guī)模將突破萬億,2023年將增長至15700億元,同比增長15.4%。

  大數(shù)據(jù)產(chǎn)業(yè)上升為國家戰(zhàn)略,數(shù)據(jù)也已成為國家、企業(yè)、個人的核心資產(chǎn),數(shù)據(jù)共享和流通成為了剛性需求。例如,人工智能的發(fā)展就依托于龐大的數(shù)據(jù)規(guī)模和數(shù)據(jù)多樣性。

  然而,數(shù)據(jù)隱私保護與數(shù)據(jù)流通和使用效率之間的矛盾卻日益凸顯。2018年,歐洲GDPR數(shù)據(jù)保護條例的頒發(fā)將Facebook、Google等互聯(lián)網(wǎng)巨頭推上了風口浪尖,數(shù)據(jù)隱私被竊取、安全泄漏等事件層出不窮。

  Facebook布局加密貨幣,表明了利用互聯(lián)網(wǎng)平臺中心化搜集用戶數(shù)據(jù),實現(xiàn)平臺化的精準營銷的商業(yè)模式不再可持續(xù)。

  去年,騰訊進行第三次組織架構調(diào)整,馬化騰發(fā)朋友圈強調(diào),鑒于騰訊各平臺數(shù)據(jù)的用戶個人隱私性較強,“我們更強調(diào)的是數(shù)據(jù)保護而非打通數(shù)據(jù)和唯算法論?!?/p>

5d12dfc6edd70-thumb.jpg

  以密碼學為核心的區(qū)塊鏈技術,似乎有望打破數(shù)據(jù)的流動壁壘,開啟數(shù)據(jù)經(jīng)濟時代新的商業(yè)模式。

  在保證隱私安全的基礎上實現(xiàn)數(shù)據(jù)共享,已經(jīng)有越來越多的公司加入這條賽道,但技術發(fā)展的速度似乎很難適應日益增長的商業(yè)需求。

  大廠涌入,賽道注定越來越擠

  2019年的科技圈,“數(shù)據(jù)中臺”是最火的概念之一。從去年年中到今年6月,“數(shù)據(jù)中臺”的百度指數(shù)從120一路狂奔達到了500多。人們對于數(shù)據(jù)中臺概念的理解普遍為實現(xiàn)大集團各子公司,或者大公司各子部門之間數(shù)據(jù)交換、資產(chǎn)化和業(yè)務化的工具。

  公信寶創(chuàng)始人黃敏強卻認為,這一概念的內(nèi)涵似乎可以拓展到企業(yè)與企業(yè)之間的數(shù)據(jù)交換與共享,甚至可以從B端邁向C端,實現(xiàn)企業(yè)到個人的數(shù)據(jù)利用和隱私保護。

  據(jù)鋅鏈接了解,早在2017年,數(shù)據(jù)共享平臺就已經(jīng)超過了100家,但還未有去中心化的數(shù)據(jù)共享平臺出現(xiàn)。

  隨后,公信寶便上線了去中心化數(shù)據(jù)交易平臺。

  黃敏強對鋅鏈接表示,數(shù)據(jù)共享與隱私問題可以通過可信計算+區(qū)塊鏈技術的方案來解決?!爱斂尚庞嬎氵\行在區(qū)塊鏈上,就擁有了中立性強、合規(guī)性高、商務成本低的特點,從而使得商業(yè)中的通用型訴求得到解決”。

  趣鏈科技于2018年末開始搭建數(shù)據(jù)共享平臺BitXMesh,大概半年后,一期產(chǎn)品上線。據(jù)其負責人汪小益向鋅鏈接介紹,趣鏈把整個項目的核心技術稱為“聯(lián)邦計算”,主要分三步走。

  首先是分布式計算,利用趣鏈搭建的BitXMesh平臺將模型分發(fā)到各個數(shù)據(jù)中心,這些數(shù)據(jù)中心分屬不同的機構或企業(yè),共同配合完成一定的計算任務。

  其次是分布式的安全計算,借助TEE(Trusted Execution Environment)可行性執(zhí)行環(huán)境,結合傳輸網(wǎng)絡的安全,實現(xiàn)分布式的安全計算。

  最后是聯(lián)邦學習,這是谷歌在近幾年提出的一類機器學習算法。趣鏈將打造聯(lián)邦學習平臺,支持用戶自定義相關學習模型,在保護用戶數(shù)據(jù)隱私的前提下充分發(fā)揮分散數(shù)據(jù)的價值,構建完善的AI模型。

  與公信寶和趣鏈所采用的硬件+密碼學結合的可信計算方式不同,PlatON堅持采用純密碼學方式實現(xiàn)數(shù)據(jù)共享過程中的隱私安全。

  PlatON首席投資官唐虹剛向鋅鏈接介紹,PlatON數(shù)據(jù)流通和共享平臺方案將基于MPC為核心的隱私計算技術,不依賴第三方硬件,實現(xiàn)Trustless下的數(shù)據(jù)隱私保護和數(shù)據(jù)確權,且具有更高的靈活性和通用性。”

  唐虹剛認為,數(shù)據(jù)共享和流通是一個非常有潛力的市場。未來,數(shù)據(jù)是繼水電煤網(wǎng)之后第五個基礎社會資源,預計市場規(guī)模將會超過萬億美元。

  黃敏強和唐虹剛的預測并非虛言,除了以上項目還有Trias、ARPA、TEEX等。今年以來,除了這些原生態(tài)區(qū)塊鏈技術公司,互聯(lián)網(wǎng)巨頭也紛紛搶灘數(shù)據(jù)共享與隱私安全領域。

  螞蟻金服在區(qū)塊鏈技術的隱私保護領域動作不斷,投資QEDIT研究零知識證明,并提出TEE+預言機技術方案。

  支付寶向鋅鏈接介紹:“支付寶十分重視區(qū)塊鏈隱私保護技術領域,認為這個領域是未來各大區(qū)塊鏈平臺競爭力的核心體現(xiàn)。支付寶從密碼學上的同態(tài)加密、零知識證明到基于硬件的可信執(zhí)行環(huán)境(TEE)技術都進行了全面布局,并已經(jīng)在不同的業(yè)務線上利用場景反復打磨?!?/p>

  百度于今年3月份上線了基于區(qū)塊鏈的數(shù)據(jù)流通平臺XuperData。百度向鋅鏈接介紹,XuperData計算方案可以實現(xiàn)數(shù)據(jù)可用不可見,在保障數(shù)據(jù)隱私和安全的前提下實現(xiàn)組織機構信用數(shù)據(jù)共享。

  “這一平臺當前主要用于解決金融機構以及其他組織機構之間信息不對等問題,提升金融機構風控能力,減輕信貸風險,從而也解決企業(yè)特別是小微企業(yè)的貸款難的問題”。

  互聯(lián)網(wǎng)巨頭紛紛涌入,數(shù)據(jù)共享與隱私安全保護這一賽道,注定越來越擠。

  技術拆解:純密碼學與TEE硬件+密碼學的較量

  在當前的區(qū)塊鏈基礎架構中,隱私保護功能往往存在著隱私性、可拓展性、鏈上計算三個維度的“不可能三角”,這意味著任意兩個維度都與第三者沖突。

  區(qū)塊鏈的隱私協(xié)議也經(jīng)歷了CryptoNote、Zk-SNARKs、TEE、MimbleWinble、以及Zether(Quorum)、MPC等的演進,應用范圍不斷擴大,從單純的保護加密貨幣交易隱私升級到數(shù)據(jù)共享的流通隱私。

5d12dfc79b646-thumb.jpg

  隱私協(xié)議演進 鋅鏈接整理

  當前國內(nèi)大部分公司的隱私路徑采用MPC等純密碼學、TEE硬件+密碼學的兩種方向發(fā)展。純密碼學方向的主流做法是以MPC(安全多方計算)、零知識證明、同臺加密等純密碼學方案,以PlatON、ARPA等項目為代表。

  唐虹剛向鋅鏈接透露,MPC既能保證數(shù)據(jù)輸入各方隱私,又能輸出正確的計算結果,且是一個成熟的密碼學算法,是完全可信的。TEE則是依賴可信第三方提供的硬件來解決安全計算問題,使用TEE則必須信任其生產(chǎn)廠商。

  “PlatON已經(jīng)對兩方計算進行了工程化實踐和商業(yè)應用,多方計算的技術解決方案也已經(jīng)完成,正在推動工程化落地,加速MPC計算的專用計算硬件也在研發(fā)中?!?/p>

  相對于MPC的純密碼學路線,所需長期的學術投入和技術商業(yè)化研究,TEE硬件+密碼學的方式則更容易實現(xiàn)商業(yè)化落地應用,當前國內(nèi)大部分公司都采用的是TEE硬件+密碼學的方案,包括公信寶、趣鏈、螞蟻金服、百度XuperData等。

  不同的公司項目采用的TEE硬件+密碼學的特點也有所不同。

  支付寶方介紹,“TEE+預言機技術”是因為支付寶判斷區(qū)塊鏈要在產(chǎn)業(yè)大規(guī)模落地,還需要突破單條鏈的局限性,讓更多的鏈下實體參與進來,需要擴展出二層、三層的鏈下網(wǎng)絡,與鏈上能力互補,形成新的協(xié)作網(wǎng)絡。

  百度稱,XuperData是通過區(qū)塊鏈構建一個去中心化的數(shù)據(jù)聯(lián)盟,“TEE或者安全多方計算是數(shù)據(jù)聯(lián)盟里面支持的兩種安全計算方式,我們支持用戶選擇合適的一種來提供?!?/p>

  趣鏈汪小益坦言,安全多方計算,就目前的技術手段來說,對參與方的數(shù)量是有限制的,三方相對可以的,但是往三方以上再去擴展,復雜度會呈現(xiàn)指數(shù)級上升?!拔覀冋J為目前這兩個技術可以并行來用,選擇最優(yōu)的技術方案賦能具體應用場景?!?/p>

  就當前所需的場景,通過多個TEE之間共同組成可信計算網(wǎng)絡達成相應聯(lián)邦計算任務對于趣鏈來說,是更合理的一種技術路線。

  由此,隱私技術協(xié)議的演化路徑反映了市場需求的方向,對于企業(yè)而言,自身商業(yè)模式選擇決定了他們所采用技術的發(fā)展路徑。

  數(shù)據(jù)隱私安全領域的“現(xiàn)實妥協(xié)”

  安全多方計算(MPC)的雛形可追溯到中國科學院院士、圖靈獎獲得者姚期智于1982年提出的百萬富翁問題,以及后續(xù)以混淆電路為主題的系列研究,姚期智是 Conflux 的聯(lián)合創(chuàng)始人和首席科學家。

  Conflux 研究總監(jiān)楊光向鋅鏈接介紹,由于適合在區(qū)塊鏈上使用的數(shù)據(jù)共享與數(shù)據(jù)隱私保護技術還不夠成熟,所以該領域目前不是 Conflux 項目最主要的突破方向。

  據(jù)楊光介紹,安全多方計算、零知識證明、同態(tài)加密是以功能劃分的抽象概念,而不是具體的技術實現(xiàn)方案,每個方向都有基于不同密碼學技術的和基于 TEE 等可信硬件的多種方案。

  “就像造汽車一樣,‘汽車’是按照最終實現(xiàn)的功能定義的。具體是搞電動的還是燒油的,用哪種電池或者燒哪種油,發(fā)動機前置還是后置,都存在很多截然不同的技術路線。”

  楊光認為,其實早在比特幣誕生之前,丹麥就已經(jīng)開始大規(guī)模使用 MPC 技術解決社會問題。當時的MPC技術主要應用場景是只有兩個或少數(shù)幾個參與者,這跟區(qū)塊鏈上的應用場景差距很大,因此直接把現(xiàn)有技術搬到區(qū)塊鏈上必然會水土不服。

  零知識證明技術也有類似的問題。因為零知識證明是基于交互式證明完成的,需要證明者和驗證者之間一來一回的頻繁互動才能向驗證者完成證明。但是在區(qū)塊鏈的應用場景下,不但難以進行多輪交互,往往還要求證明比較簡短并且可以被任何第三方(而不僅僅驗證者自己)公開驗證。

  按照當前的研究水平,采用適合區(qū)塊鏈的實現(xiàn)方案會提高使用成本,大部分企業(yè)會選擇在鏈下進行交互運算,只把最終結果上鏈完成結算。

  在技術尚未發(fā)展成熟的條件下,這也不失為一種可行的隱私保護方案,但這樣一來,隱私安全性也就打了折扣。

  至于TEE硬件+密碼學的方式,楊光認為,這個方案本身非常簡單,唯一的缺點在于需要用戶相信硬件廠商等中心化節(jié)點?!暗珜嶋H上,任何企業(yè)或者機構的可靠性都比不上完備的數(shù)學證明加上合理的安全性假設。想要正面攻破有嚴格證明的密碼學方案,需要解決某些很難的數(shù)學難題,這比搞定一家企業(yè)難多了?!?/p>

  因此,純密碼學技術應用,目前不大可能實現(xiàn)大規(guī)模的商業(yè)化應用,而TEE+密碼學的使用,只是技術為現(xiàn)實應用場景需求的妥協(xié)罷了。

  技術未滿,但需求規(guī)模卻不斷增長,而且需求緊急程度還不一樣。

  汪小益認為,金融屬于信息化程度較高的應用場景,其次是政務、醫(yī)療。同時,物聯(lián)網(wǎng)在全面鋪開的情況下對隱私安全的需求越來越迫切,因此數(shù)據(jù)共享與隱私安全在這些領域呈現(xiàn)較強、較緊急的需求。

  在趣鏈和PlatON的規(guī)劃中,區(qū)塊鏈技術與人工智能技術的結合使用是未來可預見的發(fā)展方向。

  唐虹剛則稱,未來PlatON會以隱私AI為重點發(fā)展方向,基于隱私計算實現(xiàn)的AI算法分析,可消除數(shù)據(jù)源之間的交互壁壘,通過數(shù)據(jù)的多樣性來提升AI算法的處理能力與數(shù)據(jù)覆蓋維度。

  由最初的加密貨幣隱私協(xié)議向數(shù)據(jù)共享與隱私安全保護領域拓展,區(qū)塊鏈的隱私協(xié)議經(jīng)歷了一系列的技術演進,在金融、政務、醫(yī)療、物聯(lián)網(wǎng)應用場景需求不斷爆發(fā)的今天,隱私安全計算的技術實現(xiàn)似乎心有余而力不足。

  然而,正如吳軍在《浪潮之巔》中對蘋果公司的評論:“喬布斯改變時間的發(fā)明絕非一時的靈感所致,而是數(shù)十年的深思熟慮和經(jīng)驗積累......大部分產(chǎn)品經(jīng)理之所以做不出改變世界的產(chǎn)品,是因為他們只看見了成功者最后的臨門一腳,而忽視了人的長期思考。

  數(shù)據(jù)共享是趨勢,隱私安全是保障。如今技術未滿,不能完全解決兩者之間的矛盾,數(shù)據(jù)隱私安全領域只能做出“妥協(xié)”,但隨著技術不斷迭代,臨門一腳的那天或許已不遠了。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關內(nèi)容