期刊VIP學術指導 符合學術規(guī)范和道德
保障品質 保證專業(yè),沒有后顧之憂
科學數據是大數據時代最基本、最活躍的科技資源,也是科研活動的重要輸入和產出,更是科技創(chuàng)新的基礎性戰(zhàn)略資源和核心驅動要素。只有開放共享、廣泛傳播才能使其價值最大化,可見,開放共享是實現科學數據自身潛在價值的根本途徑,也是順應科研范式轉變的必然要求。大數據時代,數據驅動研究成為一種趨勢,科學研究越來越依賴大量、系統、高可信度的數據,進而發(fā)展出第4種科研范式——數據密集型范式。由于大數據集很難獨立生成,將科學研究過程中產生的科學數據進行開放共享,符合所有供資機構、科學機構和研究界各方的利益。決策者、出版機構和資助機構也強烈認為,共享數據對科研人員非常重要,有利于科學的發(fā)展。個體科研人員在科學數據開放共享中起到關鍵作用,他們既是科研數據產出的重要力量,又是其使用者和受益者,異質科研群體間多源異構數據聚合將有效釋放科學數據的潛在價值,打破數據壁壘,連接數據孤島,實現協同效應。我國《科學數據管理辦法》明確提出,支持科研人員整理發(fā)表產權清晰、準確完整、共享價值高的科學數據。美國國家科學基金會也要求研究人員,在合理時間向公眾分享研究中產生的科學數據,并鼓勵和促進此類共享。
個人科學數據是指個體科研人員或個體科研團隊在自身科學研究活動產生的,并用于科學研究活動的研究數據及與之相關聯的個人身份數據。其關鍵在于數據主體的可識別性,也就是說,可以據此判斷數據的來源與歸屬,明確數據主體的相對數據所有權和使用權。然而,不是所有個人身份數據都屬于個人科學數據,需要根據其產生過程及使用目的加以判斷,如征信、醫(yī)療等領域通常存有大量原始身份數據,若其用于科學研究活動并與研究數據相關,則可作為個人科學數據支撐研究成果。個人科學數據共享是指個體科研人員(團隊)作為數據主體,將自身占有的具有科學價值和使用價值的原始數據及其衍生數據,賦權給對此成果有所需求的其他個體科研人員(團隊)瀏覽、使用的行為。與組織機構問的科學數據共享不同,個人科學數據共享更強調個體問的行為交互,共享的科學數據類型多種多樣,質量高低不一,共享次數更為頻繁,動態(tài)伸縮性更強,更依賴于高可信度的共享環(huán)境。然而,目前還存在數據易用性差、數據安全性低、用戶隱私被泄露等問題,數據共享的風險遠遠高于預期收益,信任體系無法建立,導致數據貢獻者共享意愿降低、共享效率低下等后果。
區(qū)塊鏈技術的發(fā)展給個人科學數據共享提供了新的選擇。2019年10月24日,習近平同志指出,要發(fā)揮區(qū)塊鏈技術在促進數據共享、優(yōu)化業(yè)務流程、提升協同效率、構建可信體系等方面的作用,探索利用區(qū)塊鏈技術的數據共享模式,實現數據跨部門、跨區(qū)域共同維護和利用。區(qū)塊鏈作為一種確保透明度、可追溯性和安全性的分布式數字賬本技術,所有區(qū)塊節(jié)點共享相同的數據,保證了數據有效性和安全性,為個體或組織創(chuàng)造一個可信的空間,解決了科學數據可信問題,有助于構建一個完善的共享數據信任體系。
在此背景下,本研究以區(qū)塊鏈技術為視角,憑借其具有的不可篡改性、可追溯性、去中心化等特點,探索構建基于區(qū)塊鏈技術的個人科學數據共享新模式,以實現區(qū)塊鏈技術賦能與個人科學數據共享的結合,引入SQL數據庫,解決科學數據存儲問題:應用智能合約和共識機制,解決個體間信任基礎薄弱問題:利用萬能數據結構表技術,解決數據可用和孤島問題:通過加密算法和授權共識技術,解決數據安全及隱私保護問題。希望本研究能為實現科學數據共享中各主體的高效互動、促進個人科學數據共享利用提供新的思考,同時為后續(xù)學者進行更深入研究提供理論參考。
1相關研究述評
1.1個人科學數據共享的相關研究
個人科學數據共享屬于科學數據共享的子領域,雖然鮮有學者專門對此進行探討,但不少有關個人數據與科學數據共享的研究,均已涉及相關論述。①在個人數據概念與類型方面,黃國彬等認為,個人數據的核心在于數據的主體識別性、構成內容的豐富性及個人數據產生與應用的場景性,并歸納出14種個人數據的基本類型;Zliobaite Ⅰ等認為,個人數據為識別型數據,指已識別或可識別的數據主體相關的任何信息。②在個人數據管理與共享方面,Anciaux N等提出個人數據管理系統應考慮功能和安全要求的結合,明確權責分擔與權益維護:針對集中數據存儲和管理更容易喪失個人數據所有權和濫用個人資料問題,PattanaikⅤ等提出基于Web瀏覽器的對等數據共享框架。③在科學數據共享方面,鄔金鳴等對人口健康科學數據中個人敏感信息做出范圍界定;傅天珍等發(fā)現,影響個體科研人員共享科學數據的因素一般有個人利益權衡、開放獲取的壓力、技術與標準問題、文化與法律因素、利他心理因素;盛小平等通過分析GDPR相關規(guī)定,為我國科學數據共享過程中個人數據保護提供了參考。
1.2區(qū)塊鏈應用于科學數據共享的相關研究
已有學者關注到區(qū)塊鏈技術在科學數據共享實踐中的應用。①在科研方面,郝世博等從主體、客體、功能3個角度說明區(qū)塊鏈應用于科學數據共享的適用性,并嘗試從技術維度改善參與者的信任危機與共享障礙:王倩等基于區(qū)塊鏈技術和演化博弈理論,分析科技服務機構數據共享的策略,在此基礎上構建了面向共享策略的智能合約激勵機制。②在醫(yī)療領域,黃茂漢基于區(qū)塊鏈技術構建一個疫情防控情報系統模型,旨在對疫情實時情況、疫苗研發(fā)進展、患者信息等進行數據共享;Kuo TT等開發(fā)了3種基于區(qū)塊鏈的分布式方法,可供相關機構共享基因一藥物相互作用的患者記錄:Balistri E等提出了BlockHealth解決方案,以實現不同公司間個人健康數據的共享。③針對數據安全,王繼業(yè)等提出基于區(qū)塊鏈技術作為動力支持的數據安全共享網絡體系,改善互信環(huán)境:張利華等設計一種基于區(qū)塊鏈的微電網數據安全共享方案,在保護用戶用電隱私的同時,促進了用戶數據的安全共享。