1. 程式人生 > 實用技巧 >利用區塊鏈進行資料安全共享的思考

利用區塊鏈進行資料安全共享的思考

摘要

資料安全共享問題、資料孤島的問題有解了,那就是利用區塊鏈。

利用區塊鏈進行資料安全共享的思考

在同行業機構間進行資料共享時,存在“資料孤島”問題,最重要的是要保證資料的安全性,在杜絕複製洩露的基礎上才有可能建立一個互信共享的資料平臺。這也是一個重要並且典型應用區塊鏈技術的方向,也就是當前AI+大資料+區塊鏈的結合趨勢,區塊鏈作為底層平臺為大資料及AI所需的資料來源提供可靠保障。

當前,各家的資料基本都是在自己的域中跑,每個平臺都只擁有自己的一部分資訊,而非全面資訊,各行業機構之間也是如此,想要打通資料間的連線,進行資料共享,實非易事。因為資料目前已成為平臺或企業的核心資產和財富,沒有人真的願意共享。即使是交換資料,一些機構也會有意或無意地提供一些低質量的資料。當資料質量得不到保障時,再好的資料模型,也無法得出正確的結果。總而言之,資料共享在網際網路架構下是無法得到很好解決的,因為資料是可以輕易地進行復制、傳輸的,無法保障資料安全。因此,以資料為核心資產的平臺同行業間共享資料是存在極大風險的。

區塊鏈及加密技術的發展,為解決這個問題提供了一些新方案,比如由區塊鏈提供一個可信的“黑盒”,大家可以把自己資料放心地放進去,不用擔心被複制或洩露;或者將雙方資料共享前先加密,再進行計算,計算結果也是密文。像這樣的方式既可以完成必要的資料共享、安全計算,又不會使資料或者模型洩露給其他人,從技術上有效解決這個問題,相關資料擁有方的合作動力應該會更大。

在資料共享場景中,諸多“資料共享聯盟”間能否形成一個類似“資料市場”,一方是資料、演算法模型的提供者們,另一方是資料、演算法模型的買者們。基於區塊鏈的資料市場可以有效避免資料的洩露覆制,在區塊鏈的保護下,安全地共享資料,並且利用區塊鏈中的智慧合約去自動執行一些邏輯,比如無可爭議地去統計使用情況並計價或者進行資料交易。

區塊鏈解決方案

關於資料安全共享,可以有幾種區塊鏈技術方案:

①同態加密

②零知識證明

③多方安全計算(MPC)

④可信執行環境(TEE硬體)

其中,①-③是密碼學技術,④是一種與CPU硬體結合的技術,現較為成熟的是同態加密以及TEE技術。

舉例:

密碼學技術解決示例,一種方案思路:

利用區塊鏈進行資料安全共享的思考

在該資料生態當中有眾多參與者,每個使用者都需要在區塊鏈平臺註冊,並分配相應的公鑰與私鑰,區塊鏈平臺擁有每個參與者的公鑰以及數字證書,因此可以輕鬆驗證任何授權使用者的交易,這是資料許可權管理的關鍵。原始資料始終歸自己私有,不上鍊亦不出域,鏈上只儲存資料的地址,區塊鏈通過請求者要求找到資料地址,並向該資料擁有者請求資料。假設有機構A、B、C各自持有資料,A發起共享請求,當A需要B的資料進行資料共享計算時,請求者A發出請求交易並附上自己的公鑰A。當區塊鏈平臺收到此交易請求後,驗證該請求者,若不是合法使用者,拒絕交易。若通過驗證,則通過智慧合約查詢該資料的地址。當合約查詢到資料地址是B時,向其請求資料。資料擁有者B通過在其資料庫中檢索查詢到資料,此時,B用自己的私鑰與請求者A的公鑰生成重加密金鑰,該金鑰用來加密從資料庫中取出的明文資料,通過加密生產加密資料並返回給區塊鏈。區塊鏈收到加密資料後再次請求B的私鑰以及B參與計算的資料,同時開啟加密計運算元鏈,該子鏈只用於安全計算,不被鏈上任何參與方所知曉,它有著極高的計算效率與較少的共識驗證,保證計算任務的高效完成,完成任務後自動銷燬。當加密計運算元鏈完成計算任務後將計算結果返回給主鏈,鏈再整合其他方的計算結果並將彙總計算結果返回給A,完成整個計算任務。在整個區塊鏈系統中,使用智慧合約對資料的使用情況進行統計及估價,若引入通證激勵模式,可讓貢獻資料者自動獲得相應的通證獎勵,形成具備自由規則的資料市場。