计量科学数据可信度研究

2024-12-01 00:00:00刘子龙龚浩王娟熊行创
农业大数据学报 2024年2期
关键词:数据安全

摘要:科学数据安全既是科学数据管理理论发展的内在需求,也是科学数据发展的现实需要。在计量领域,随着计量数字化转型发展,计量科学数据安全在数据安全普遍意义的基础上提出了可信的要求。国际计量局(BIPM)制定的发展战略CIPM2030+中提出计量数字化转型要实现“远程+X”,其提供的服务仍然是计量科学数据。因此在“远程+X”计量中,实体世界中计量的权威性转化为数字世界中计量科学数据的可信度。本文提出了从三个途径建立计量科学数据可信度的方法,即分别从数据产生主体的防抵赖和身份可信、数据传输过程的防篡改和可追溯,同时给出相应的实现技术建议,并具体介绍了中国计量科学研究院在实现计量科学数据可信方面的数据安全体系设计。通过这些研究有助于建立计量科学数据的可信体系,为计量科学数据的安全应用和计量数字化转型构建可信基础。

关键词:数据安全;数据可信;计量数字化转型;数据可追溯

1 "引言

科学数据是数字时代的新生产要素,中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》[1](数据二十条)、国家数据局等17部门《“数据要素×”三年行动计划》[2]均指出数据要素应在各领域流通共享。数据安全是高质量共享的基础。尤其对于科学数据,采用数据安全构建高质量共享作为科学研究的新范式。计量作为构建国家一体化战略体系和能力的重要支撑,计量领域的科学数据发挥着数据基础标准的作用,其安全性主要体现在数据的可信。可信的计量科学数据,才能构建标准参考数据,在数据共享中成为国家计量标准。

另一方面,国际计量界正在大力开展计量数字化转型。国际计量局(BIPM)与国际科学理事会数据委员会(CODATA)、国际标准化组织(ISO)等10个国际组织共同签署了关于计量数字化协议[3],科学数据是其中的重要内容,指出科学数据在高质量共享中应遵循FAIR+T化原则。同时国际计量局(BIPM)制定了应对全球数字化变革的计量战略CIPM2030+[4],指出数字时代计量的重要模式是“远程+X”,即远程校准、远程检定和远程测试。“远程+X”是以数字技术方式提供计量科学数据服务,例如以远程检测代替原有的现场检测,实现一种计量数字化转型。对数字化校准对象来说,远程检测更准确、更直接、更高效。远程检测相较于原有现场校准方式,要解决的核心问题是数据的可信。因此在“远程+X”计量中,实体世界中计量的权威性转化为数字世界中计量科学数据的可信度是建立计量科学数据可信体系的重要基础。

2 "计量科学数据可信度

计量数字化转型工作在国内外尚为起步阶段,目前对于计量科学数据的可信度还没有明确定义。“计量与数字化”属于交叉科学,对于计量科学数据可信度的研究,需结合计量学、信息技术、数据科学等学科的相关内容开展研究。根据计量数字化转型的基本目的,计量科学数据是为计量数字化转型后的计量活动服务的,其中一种重要模式即为“远程+X”计量。因此,计量科学数据的可信度可以根据“远程+X”的计量基本模式,从数据的全流程安全角度进行定义。

从数据的全流程安全分析,参照国际计量界的通用方法[5],计量科学数据的安全可分为产生和传输两个阶段。在数据产生阶段,安全问题重点是数据产生主体。数据产生主体可能产生的数据安全问题主要有对于数据归属的抵赖,以及主体身份的可信。在数据传输阶段,安全问题重点是传输过程。传输过程可能产生的数据安全问题主要有数据在传输过程中是否被篡改,以及数据经过传输之后是否还可以被追溯。尤其是在可追溯方面,应该重点关注的计量科学数据特色安全问题。计量的基本特征之一是溯源性。溯源性在计量领域是指“通过文件规定的不间断的校准链,测量结果与参照对象联系起来的特性,校准链中的每项校准均会引入测量不确定度”[6] 。其中“参照对象可以是实际实现的测量单位的定义,或包括无序量测量单位的测量程序,或测量标准”。因此当计量数字化转型时,由“测量程序”体现的计量溯源性更为明显。尤其是溯源性有时是指量值溯源性,有时也用于非量值概念,即指某项目的历程(“轨迹”)。诸如样品可追溯性,文件可追溯性,仪器可追溯性。因此在计量科学数据的安全性方面,计量溯源性可明确为数据自身的可追溯性。

综上,从计量科学数据的安全性方面分析,计量科学数据可信度的内涵包含了数据产生主体的防抵赖和身份可信、数据传输过程的防篡改和可追溯,即数据可信度是指数据是否在防抵赖(含身份可信),被篡改、可追溯三个方面实现了安全。因此,数据安全意义上的计量科学数据的可信数据结构由最小字段、计量特性字段、安全(可信)字段共同构成,如图1所示。

3 "计量科学数据可信度的建立方法

按照计量科学数据可信度的内涵, 计量科学数据可信度的建立也需依赖三方面的技术,即数据防抵赖(含身份可信),被篡改、可追溯技术,且需结合计量特色,即溯源性。

数据防抵赖(含身份可信)方面,主要可以采用基于CA证书[7]的数字签名[8]技术。CA数字证书提供数据产生主体的身份可信。数字签名附加在数据单元,或对数据单元做密码变换,这种附加数据或密码变换被数据单元的接收者用以确认数据单元的来源和完整性,可以防止数据产生主体对数据产生行为的抵赖。基于CA数字证书的数字签名技术,结合了两种技术的优点,可以在数据防抵赖(含身份可信)方面有效地实现数据安全意义上的计量科学数据可信。

数据防篡改方面,主要可以采用面向计量数据字段的国密算法SM3技术。使用国密算法SM3[9],即杂凑算法,可以作用于计量科学数据,产生输出时的消息摘要(比特串)。该消息摘要对于传输的数据具有唯一特性,尤其是当被传输的数据具有更多的计量属性字段,例如测量数据的主体信息、数据的测量条件、数据测量依据的基标准、数据测量的不确定度等,使得该消息摘要更具有加密性。因此面向计量数据字段的国密算法SM3技术,可以在数据被篡改方面有效地实现数据安全意义上的计量科学数据可信。

数据可追溯方面,主要可以采用时间同步技术和可信时间戳技术。时间同步是指每一个计量科学数据结构,都包含一个时间字段(如图1中所示)。该时间字段的含义是数据产生的时间,即产生数据的计量测试活动时间。由于所有的计量测试活动都具有该属性,而且该属性可以通过完善的不间断时间溯源链建立可信度,因此该字段既是计量科学数据的元数据,同时也是可以提供数据追溯的可信字段。我国以时间频率基准直接复现秒定义(目前国际单位制中时间的基本单位)[10],为国家最高的时间标准。该基准通过独立测量和计算得到实际复现值及其不确定度,此不确定度称为基准的准确度,用相对值表示。目前只有少数几个国家研制出了时频基准,准确度达到了10-15量级。目前我国的时间频率基准装置是铯原子喷泉时频基准,一种新型的时间频率基准装置,由于铯原子运动速度很低,也大大减小与速度有关的一些因素在复现时引入的偏差,故可得到很高的准确度。所有的终端计量活动的时间属性都可以溯源至此国家基准,在保证时间的准确性的同时自然建立了时间的可信(如图3中的基准时间同步所示)。时间戳[11]则是使用数字签名技术,对被签名的数据对象进行运算产生的数据。签名的对象包括原始文件信息、签名参数、签名时间等信息。时间戳可以证明原始文件在签名时间之前已经存在。可信时间是经计量溯源具有一定不确定度水平的时间。以溯源至此基准的时间以及其他内容作为签名对象,产生可信时间戳,作为计量科学数据的追溯关键字段,可以使时间戳具有了不间断的高精度溯源链,保证了计量科学数据可追溯的质量。因此可信时间戳技术,可以在数据可追溯方面有效地实现数据安全意义上的计量科学数据可信。

以上三方面的技术并不是独立使用,在实现数据可追溯方面的可信时间戳技术就使用了数据防抵赖(含身份可信)方面的数字签名技术。同时,所有技术都结合了计量科学数据的溯源性特性,是面向计量科学数据溯源性字段进行加密,因此三方面的技术应综合运用,可以有效地实现计量科学数据的可信,达到数据产生和传输过程高度透明、数字可验证、易辨

真伪、计量可追溯的目的。

4 "实现计量科学数据可信的安全体系设计

计量科学数据可信度的实现技术需要综合使用,才能发挥保障计量科学数据安全的作用。因此,需要设计一种计量科学数据可信的安全体系实现计量科学数据的可信。该体系需包括计量科学数据及其可信度的实现技术两部分,其中计量科学数据可信度的实现技术包含了三个方面即数据防抵赖(含身份可信),被篡改、可追溯,同时又是综合应用,没有明确的界限,包括但不限于CA证书、数字签名、数据加解密、时间同步技术和可信时间戳等技术。

中国计量科学研究院(下称中国计量院)已经进行了多年的计量数字化转型研究,其中包括了计量科学数据安全体系研究,目前形成了综合应用计量科学数据可信度实现技术进行计量科学数据安全运行的体系。该体系按照计量科学数据可信度的内涵和建立方法建设,其原理图如图2所示。

该体系主要功能分为两部分,分别为可信计量科学数据的生成和经传输后计量科学数据的可信使用。

可信计量科学数据的生成部分,综合采用CA证书、数字签名、数据加解密、可信时间戳等可信技术,生成叠加明文、暗文、明文二维码的可信计量科学数据。对于计量活动,表现形式为一份可信计量证书。具体过程为,首先获取证书系统和证书服务器,证书系统中包含用于非对称加密的公钥和私钥,证书服务器则用于保存时空证书;其次对于每个计量活动产生的原始计量数据,生成一个哈希值,再使用私钥,通过SM2算法对哈希值进行加密得到签名暗文,同时获取到操作系统时空信息形成时间空间明文,通过时间空间明文和证书系统生成明文二维码,将时间空间明文和明文二维码叠加到初始计量数据上生成叠加明文、二维码的可信计量数据。在计量数据的本体层面,将之前生成的暗文写入,最后生成叠加明文、暗文、二维码的可信计量数据本体文件,即数字校准证书(DCC)[12],也可同时生成可视化的计量证书。

经传输后计量科学数据的可信使用,则是通过证书检验、暗文检验、明文检验经传输得到的计量科学数据(计量证书),以判断该数据(证书)是否可信。首先扫描明文二维码查询证书服务器上的时空证书信息,对时空证书信息进行证书检验,得到证书检验结果,若匹配则证书检验结果为真,若不匹配则为假。然后对于明文使用方式,则可以查看数据证书的时间空间明文与传输前的明文是否一致,得到明文检验结果,若一致,则明文检验结果为真,反之则为假;对于加密文件(暗文)使用方式,先获取证书系统中的公钥,再获取叠加明文、暗文、二维码的签名文件。通过公钥和签名验证系统对暗文进行检验,使用公钥对得到的签名文件进行解密,得到暗文检验结果,若匹配则证书检验结果为真,若不匹配则为假。综合证书检验结果和暗文检验结果得到计量数据证书检验结果,当证书检验结果、暗文检验结果、明文检验结果都为真时,计量数据证书检验结果为真,即该计量数据证书可信,其余情况检验结果皆为假,即该计量数据证书不可信。

该计量科学数据安全体系已经形成了CA数字签名、基准时间同步、可信时间戳、可信视频综合应用四个方面的特色系统,实现时间可信、身份可信、内容可信、视频可信。中国计量院的可信计量科学数据安全体系构筑了国家质量基础设施NQI数字化安全基础。如图3所示。

5 "总结

本文提出的方法是对计量科学数据可信的阶段性研究成果,依据该研究成果构建的计量科学数据安全体系经过了实践的检验。目前,计量数字化转型工作还处于起步阶段,因此计量科学数据本身将有更多的研究结果和规范,面向计量科学数据的可信技术也会不断进步。随着研究的深入和国内外技术的发展,包括可信在内的计量科学数据的安全将会有更丰富的内容。

参考文献

[1] 中共中央、国务院,《关于构建数据基础制度更好发挥数据要素作用的意见》[G],[2022-12-02].

[2] 国家数据局、中央网信办、科技部、工业和信息化部、交通运输部、农业农村部、商务部、文化和旅游部、国家卫生健康委、应急管理部、中国人民银行、金融监管总局、国家医保局、中国科学院、中国气象局、国家文物局、国家中医药局,《“数据要素×”三年行动计划(2024—2026年)》[G],[2023-12-31].

[3] signatories of the Joint Statement of Intent (JSI) , Joint Statement of Intent on the digital transformation in the international scientific " and quality infrastructure[G]. https://www.bipm.org/en/liaison/digital- transformation.

[4] BIPM,CIPM2030+[G]. https://www.bipm.org/en/search.

[5] EURAMET, Document specifying rules for the secure use of DCC covering legal aspects of metrology. https://doi.org/10.5281/zenodo. 3664211, 2020.10.26.

[6] 国家计量技术规范[S],JJF1001-2011,通用计量术语及定义.

[7] 国家标准,GB/T 25056,信息安全技术 证书认证系统密码及其相关安全技术规范[S].

[8] 国家标准,GB/T 25069,信息安全技术 术语[S].

[9] 国家标准,GB/T 32905,信息安全技术SM3密码杂凑算法[S].

[10] 国家计量技术规范,JJF1180-2007时间频率计量名词术语及定义[S].

[11] 国家标准,GB/T 20520,信息安全技术 公钥基础设施 时间戳规范[S].

[12] 数字校准证书(DCC)[DB],https://www.nim.ac.cn/dcc/#/homepage/ contentdetail?id=fe9049b1-7455-4ee8-be17-defb3e4ee252amp;routeId=1amp;ver=fe9049b1-7455-4ee8-be17-defb3e4ee252.

引用格式:刘子龙,龚浩,王娟,熊行创.计量科学数据可信度研究[J].农业大数据学报,2024,6(2):253-258.DOI:10.19788/j.issn.2096-6369.000034.

CITATION: LIU ZiLong, GONG Hao, WANG Juan, XIONG XingChuang. Research on the Trusted Level of Metrology Scientific Data[J]. Journal of Agricultural Big Data:2024,6(2):253-258. DOI:10.19788/j.issn.2096-6369.000034.

Research on the Trusted Level of Metrology Scientific Data

LIU ZiLong1,2, GONG Hao1,2, WANG Juan1,3, XIONG XingChuang1,2,*

1.Center for Metrology Scientific Data, National Institute of Metrology, Beijing 100029; 2.Key Laboratory of Metrology Digitalization and Digital Metrology for State Market Regulation, Beijing 100029; 3. China Jiliang University, Hangzhou 310018

Abstract: Scientific data security is not only an inherent requirement for the development of scientific data management theory, but also a practical need for the development of scientific data. In the field of metrology, with the development of metrology digital transformation, reliable requirements have been put forward for data security in metrology science based on the universal significance of data security. The development strategy CIPM2030+formulated by the International Bureau of Weights and Measures (BIPM) proposes to achieve \"remote+X\" in the digital transformation of metrology, and its services still focus on metrology scientific data. Therefore, in \"remote+X\" measurement, the authority of measurement in the physical world is transformed into the credibility of scientific measurement data in the digital world. This article proposes three methods to establish the credibility of metrological data, namely, the anti-repudiation and identity trustworthiness of the data generation subject, the anti-tampering and traceability of the data transmission process, and provides corresponding implementation technical suggestions. It also specifically introduces the data security system design of the National Institute of Metrology in achieving the credibility of metrological data. Through these studies, we will gradually establish a trustworthy system for metrological scientific data, and build a trustworthy foundation for the secure application of metrological scientific data and the digital transformation of metrology.

Keywords: data security; trusted data; metrology digital transformation; data traceability

猜你喜欢
数据安全
高速公路ETC用户隐私数据安全保护策略
我国5G数据安全保护供给不足,“四步”拉动产业发展
云计算中基于用户隐私的数据安全保护方法
电子制作(2019年14期)2019-08-20 05:43:42
建立激励相容机制保护数据安全
当代贵州(2018年21期)2018-08-29 00:47:20
大数据云计算环境下的数据安全
电子制作(2017年20期)2017-04-26 06:57:48
大数据安全和隐私保护技术架构研究
实时数据库系统数据安全采集方案
电信科学(2016年10期)2016-11-23 05:12:00
云环境中数据安全去重研究进展
通信学报(2016年11期)2016-08-16 03:20:49
数据安全重删系统与关键技术研究
大数据安全搜索与共享