“人類正在經歷一場前所未有的數字化革命,科學數據的豐富度、關聯性與開放性,將成為21世紀驅動科技創新的核心要素。”近日,在北京召開的國際數據委員會(CODATA)2019年學術大會上,中國科學院副院長、中國科學院大學校長李樹深院士認為,繼“觀察實驗”“理論分析”“計算模擬”之后,“大數據驅動科學發現”已成為科學研究的第四范式。
????但在現實世界中,科學數據的發展也面臨著機遇和挑戰并存的局面。“海量且多樣化的科學數據不斷產生,大家卻沒有足夠的系統去存儲或者處理,80%有價值的數據都在兩年之后就浪費了。”國際數據委員會主席Barend?Mons認為,過去的一些系統和方法已經不適用于當下的大數據時代,機器的智能化處理和使用數據的能力亟待提升。
????“的確,在推動科學數據管理和開放共享工作向縱深發展的過程中,我們也發現還有許多政策問題需要探索。”國家科技基礎條件平臺中心主任蘇靖坦言,如何真正實現科學數據可發現、可訪問、可互操作和可重用?如何通過建立通用互認的科學數據標識體系來保障數據知識產權?如何進一步使科學數據的全生命周期和統一的技術標準更加完善?如何有效推動科學數據的開放和傳播,同時保障數據的安全?如何使科學數據的應用成為解決復雜問題、推動科技創新的真正驅動力?等等。“這些問題的探討和解決正逐步提上議程,中國也正在成為國際上推動科學數據資源建設與發展的重要參與者。”
????去年,國務院辦公廳正式發布《科學數據管理辦法》,并啟動了國家科學數據中心的部署和建設工作。時隔一年,科技部和有關部門立足前期工作基礎,在高能物理、基因組、氣象、地震、海洋等領域組建了20個國家科學數據中心。這些中心將成為我國科學數據管理和開放共享方面重要的基礎設施和載體。
????對于國家層面出臺的第一個科學數據領域的管理辦法,中科院院士郭華東表示,這使得科學數據的管理和使用有了可遵循的章程和依據,也使得科學數據的開放共享在科學界達成共識。但他同時也提出:“在《辦法》推進的過程中還需要著力解決數據權益保障等一系列問題,才能使辦法真正落實落地。”
????CODATA中委會副主席、中國科學院計算機網絡信息中心主任廖方宇進一步解釋說,站在科學家個人的角度來講,存在一個科研競爭的壓力問題,有的人很難得到科研數據,但有的人有了科研數據卻不一定能產生很好的結果,如何來平衡評價?應該出臺什么樣的激勵機制?另一方面,從國家的利益考慮,在國外核心期刊發表論文,科研數據提交到指定的儲存機構,有時候就必然面臨數據流失、知識產權得不到保護的問題。
????而國家基礎學科公共科學數據中心主任胡良霖最關心的則是數據質量的問題,哪些數據需要保存?該如何保存?比如,一些數據在最初采集的時候成本比較大,經過幾年采集技術的快速發展,成本已經大大降低,而長期使用的存儲介質的費用遠高于最新采集的成本,要不要把歷史上存留的這么多數據都保存下來?他建議,我國急需建立自主可控的國際級權威數據庫,推動科學數據的分級保存,并且對保存的數據做出明確分級指導和界定。
????會上,一些與會專家也呼吁,國際數據同樣需要在全球開放共享。“多國科學家貢獻科學數據共同建設的數據庫,應當在貢獻者所在國提供鏡像服務,以保證各貢獻國對數據的平等獲取權;對于國際期刊發表論文要求提交數據,期刊應當與論文作者所在國聯合確定論文關聯數據的存儲機構,首選在其所在國的優質數據存儲機構。”專家們說。
????蘇靖表示,希望國家科學數據中心能夠很好地承擔起科學數據管理和開放共享的功能,支撐更多具有世界領先水平的重大科學發現和原創性的技術突破,推動科技創新能力提升和經濟社會發展。
-
數據庫
+關注
關注
7文章
3799瀏覽量
64375 -
數字化
+關注
關注
8文章
8729瀏覽量
61750
發布評論請先 登錄
相關推薦
評論