产业大脑数据资源开放共享与安全机制研究

2021-08-14 05:24|胡胜蓉曹婷田雨辰
信息化建设 2021年6期
关键词:公共数据数据安全大脑

|胡胜蓉 曹婷 田雨辰

构建产业大脑数据资源共享开放安全机制,从技术层面和制度层面双管齐下,确保数据在安全的前提下有序共享开放是当前数字化改革背景下产业大脑建设的当务之急

产业大脑在促进政府和企事业单位数据汇聚共享交换的同时,要充分遵循“分级分类管理、体系化推进”的原则,通过顶层设计,处理好相互关系和应用模式,在数据“可用不可见”的安全基础上,确保数据在数源单位、平台中枢、使用单位之间高效高质量流动。

2021年,浙江省全面启动数字化改革进程,以“产业大脑+未来工厂”为核心的数字经济系统应用是全省数字化改革“152”工作体系的重要组成部分。随着数字经济系统的深入推进和产业大脑的持续建设,产业大脑将汇聚大量政府侧和企业侧数据,如何推动这些海量数据的有序规范开放共享,确保数据的安全使用,是发挥数据要素作用、持续推进产业大脑建设乃至数字化改革真正落地的关键。构建产业大脑数据资源共享开放安全机制,从技术层面和制度层面双管齐下,确保数据在安全的前提下有序共享开放是当前数字化改革背景下产业大脑建设的当务之急。

政企联动,规范数据开放共享机制

数据作为数字变革时代最具时代特征的关键生产要素,对促进经济社会发展,发挥着越来越重要的作用。一方面,完善数据开放共享机制是充分释放数据价值的现实需要。另一方面,建立数据开放共享安全机制是经济领域数字化改革能够落到实处的先决条件,也是推动产业大脑可持续迭代建设的保障条件。近年来,政府和企业一起联手,加快探索数据开放共享安全机制和标准规范的建立。

政府数据开放共享安全机制逐步建立。随着政府数字化转型以及数字浙江建设的不断推进,政府数据开发共享机制逐步建立。为了统筹管理公共数据资源和电子政务,推进政府信息资源整合利用,实现数据共享,助推“最多跑一次”改革和政府数字化转型,2018年,浙江省组建浙江省大数据发展管理局,随后相继制定了《浙江省政务数据安全管理办法》(省政府令第354号)、《浙江省公共数据共享开放安全管理暂行办法》(省政府令第381号)、《浙江省公共数据治理工作细则》(浙数局发〔2019〕1号)、《浙江省公共数据开放及信息安全管理办法》(2020.04)、《浙江省公共数据共享工作细则(试行)》(浙数局发〔2020〕4号)、《浙江省公共数据分类分级指南(试行)》(2020.07)、《浙江省公共数据开放工作细则》(2020.08)、《浙江省公共数据安全脱敏技术规范(试行)》(浙数局发〔2020〕5号)等公共数据开放共享安全规范文件,从部门安全管理、共享安全管理、开放安全管理、应急管理、安全检查等方面制定了相应的数据管理办法及细则,逐步建立起政府数据开放共享及安全管理体系。

企业积极探索数据开放共享安全规范。浙江省作为国内互联网发源地,基于构建互联网数据生态安全体系,省内龙头企业积极探索建立行业数据共享安全规范。2019年,阿里巴巴推出业内首个数据安全认证机制。该机制主要依托阿里巴巴御城河(阿里巴巴的信息安全保障系统,有较强的信息安全防御功能)产品,结合阿里云安全解决方案,从事前、事中和事后预警、响应与防控,对数据进行全链路安全保护。在事前,基于数据安全能力成熟度模型(简称DSMM)国家标准,对软件开发商(ISV)等主体进行安全认证评估;事中对风险事件进行全天候监测;事后对异常行为和漏洞等问题进行快速即时处置。同时,该机制向数据使用方透出数据安全心智,让使用者在挑选数据产品及服务时,将数据安全能力作为重要参考指标,通过市场机制让ISV、商家等主体自觉提高数据安全能力和意识,成功构建了ISV、商家、数据使用方等多方共同参与的数据安全生态共治模式,有效推进了数据安全治理。

产业大脑建设机制加快探索形成。全省产业大脑建设正在快速推进,已研究制定产业大脑建设方案及产业大脑建设应用试点方案,以化工产业大脑为突破口,以揭榜挂帅方式分批推进全省优势细分领域产业大脑建设试点,初步形成第一批产业大脑建设试点“揭榜挂帅”目录,积极探索生态建设、共性技术等内容。同时,产业大脑制度规范与运营机制创新也在同步推进。加快研究产业大脑标准体系、行业规范、评价制度及运营模式等机制创新,探索数据开放共享安全规则,正研究出台《产业大脑安全保障体系建设导则(试行)》《产业大脑数据资源开放共享管理指南》《产业大脑政府侧公共数据共享开放暂行办法》等管理办法,努力构建数据共享开放安全“底座”。

建设实践中,仍存在诸多瓶颈

产业大脑的建设对于政府部门间、政企间、企业间数据多向流动、共享融合提出了新的要求,在“摸着石头过河”的过程中,有效促进政企数据共享、激活数据要素价值仍存在制度、标准、技术等诸多方面的瓶颈。

部门间数据交换的全量性时效性不足。部门间数据孤岛未完全打破,数据归集缺乏全局全量性,无法满足业务协同需求。同时,数据交换的方式还有待优化,“数据高铁”覆盖率仍然不高,各部门各业务信息系统不少由于网络不能互通、保密性质不同、业务逻辑不一样等原因,主要仍采用API接口、电子表格人工导入导出等手段,数据更新频率按月或者按天的居多,时效性不强,难以实现动态监测。

政府与企业间数据共享机制有待破题。政府面向企业开放共享公共数据的安全管理办法和工作细则正逐步完善中,产业大脑公共数据开放管理办法正加快制定中,数据权属、使用和安全监管责任仍有待进一步厘清和验证,行业监管仍然不足。同时,企业向政府共享数据方面,除税务、市场监管等强制采集一般性经营数据外,企業只有在享受政策、申报项目等过程中,才有意愿上报部分数据,大部分企业对政府数据共享存在疑虑,面向企业的激励机制不完善,导致企业意愿不足。

产业大脑数据范围及相关标准尚未完善。市场化数据共享领域发展仍然处于起步阶段,相关数据的定义、范围、权属、价值评估、数据质量管理、接口标准和交换协议等标准规范缺失,亟需顶层设计、体系化推进数据标准建设,促进数据高效互通。同时在工业方面政府掌握的企业数据单一,但是工业互联网平台的建设导致数据丰富,数据共享协议增多,容易各自发展自成体系,形成新的“信息孤岛”。

数据总体质量和可用性有待提升。由于数据来源的多样性、数据结构的复杂性、相关标准规范缺失、主观性表达和理解偏差等因素影响,数据在归集过程中容易形成大量无效数据、重复数据、错误数据等,降低了整体数据的可用性,提升了数据处理的成本,也会对训练预测模型造成偏差,造成应用效果不佳。

数据安全共享的技术支撑有待加强。区块链、多方安全计算、同态加密、联邦学习等相关技术,在跨部门跨企业数据安全共享领域的技术框架和应用模式尚未形成成熟可复制的案例。同时,数据质量不高、异构数据大量存在也极大地影响了安全共享技术在实现数据“可用不可见”过程中的难度。安全技术的冗余还影响了数据流动的高效性。

分级分类,构建数据开放共享机制框架

产业大脑作为“集成产业链、供应链、资金链、创新链,融合企业侧和政府侧,贯通生产端与消费端”的赋能平台,在促进政府和企事业单位数据汇聚共享交换的同时,要充分遵循“分级分类管理、体系化推进”的原则,通过顶层设计,厘清政府部门之间(G2G)、政府与企业之间(G2B、B2G)、企业与企业之间(B2B)数据流,处理好相互关系和应用模式,在数据“可用不可见”的安全基础上,确保数据在数源单位、平台中枢、使用单位之间高效高质量流动。其中,需要重点处理好产业大脑一体化综合支撑系统和行业产业大脑、工业互联网平台之间的分级分类关系,产业大脑与应用企业、各级部门之间的关系等。

同时,在明确数据共享开放范围、权属的基础上,按照数据汇聚融合、开放使用、管理评价、安全保障全流程,明确G2G、G2B、B2G以及B2B之间数据共享交换的相关标准规范和安全保障要求。为此,笔者初步提出产业大脑数据开放共享的制度框架(如图1所示),主要包含总体标准、数据汇聚融合、数据开放使用、数据管理评价和数据安全保障等几个部分。

总体标准规范。总体标准主要提供产业大脑数据开放共享与安全制度体系总体框架性、概念性、基础性的标准规范说明,包括相关术语定义、范围说明,数据所有权、使用权、经营权分类界定和责任明确,数字经济类核心元数据定义、描述界定框架,产业大脑数据分级分类管理目录,产业服务目录等。

数据汇聚融合。数据汇聚涉及企业侧、政府侧两端,需要跨网络、跨网闸汇聚多源异构数据,应有相对统一数据格式、标准等,便于数据源端与目标端的统一管理。数据融合是产业大脑运行的重要支撑,需要根据业务流程明确数据表达方式和业务语义,通过数据治理确保数据的一致性和数据质量。因此,在数据汇聚融合阶段,根据数据的标准化、实时性、可用性等要求,重点建立完善数据格式类型要求、数据采集手段方式、数据提交规范要求、数据审选验证、数据采集范围和分类目录、数据脱敏范围和应用流程等规范。

数据开放使用。数据开放使用主要涉及政府侧与企业侧数据双向开放使用,数据使用过程中应遵循最小化使用原则,要通过严格的账号体系、授权体系、使用管理体系,确保数据合理、安全使用。在具体方式上,可以通过数据批量开放、数据服务API等方式提供给各部门、各企业使用。数据使用方需要在授权范围内获取和使用数据,并采取措施,确保交换数据不丢失、不泄露、不被未授权读取或扩大使用范围。数据开放使用的具体标准应包括数据开放范围、数据提供方式、数据使用确权等方面的制度标准。

数据管理评价。平台还应承担数据的管理、维护和评价,包括对开放共享的数据进行清洗、审核、编目、归集、存储、提供等,并对数据提供和使用活动进行记录。数据资源的管理应遵循数据标准体系,应用统一的数据定义、数据分类、记录格式和转换编码等实现数据的标准化,确保数据及时更新,并保障数据的质量。同时,还需形成数据评价体系,加强对数据质量的监控、分析、维护、问题处理等,促进数据资源持续优化迭代。主要规范标准要求包括数据存储、数据更新、数据质量管理、评价分析和反馈优化、数据日常维护等方面的管理评价方式和操作流程。

数据安全保障。数据安全保障是标准体系的重要组成内容,可以从法律法规、管理制度、技术应用等方面着力,推动数据高效开放共享和数据安全相平衡。具体需要制定数据共享安全技术要求、风险评估要求、数据安全事件应急管理、安全监督体系、法律保障体系等方面。

六项建议,促进数据安全開放共享

明晰政府企业数据共享权责。责权明晰是政企数据共享的基础。总体而言,政府统筹推进省级产业大脑综合支撑系统建设,为数据共享提供基础平台支撑;政府、企业共同参与分行业产业大脑及应用场景建设,推动数据资源共享利用。在具体应用场景中,政府和企业分饰数据提供方、数据使用方、平台管理方、服务提供方和监管方等不同角色,分别承担确保数据准确性、在授权范围内获取和使用数据、加强数据管理维护等不同职责。建立完善政府、平台型企业、数据市场主体等多方参与新型监管机制,规范数据使用行为,以数据采集最小化、使用目的限制、尊重商业利益等为原则,推动数据开放共享和价值共同创造。

建立健全数据分级分类制度。根据相关法规和标准,建立健全产业大脑数据分级分类制度,分别对政府数据、企业数据进行分级分类,确定各类数据的敏感程度和安全级别,综合公众权益、个人隐私、企业合法利益等因素,结合数据共享需求,分别制定管理规范和流动标准,持续完善数据共享目录清单,为产业大脑提供数据精细化管控的依据。细分行业产业大脑,应充分考虑行业特点、行业数据复杂程度等,结合生产制造模式、平台企业服务运营模式等,对产业数据进行分类梳理和标识,完善行业数据分类清单,提升数据管理能力,依法挖掘数据价值。加强数据质量治理,明确数据全生命周期各环节质量管理流程,提高数据准确性、一致性和可用性。

推进数据共享激励机制创新。在推进产业大脑数据共享的过程中,应加强激励机制和商业模式创新,激发企业参与数据开放、应用和开发的积极性和主动性。探索建立企业数据开放评价体系、积分制度等,将企业开放的数据质量、贡献度等纳入评价体系,对积极开放数据的企业在享受政策、承担试点示范任务、对等开放高价值公共数据等方面予以支持。探索开展“政—金—产—数”(政府、金融、产业、数字技术)四方联动的数据开放共享金融服务模式创新,促进企业应用产业大脑推进数据开放与创新应用。

探索完善数据知识产权保护。在产业大脑建设运营和迭代升级的实践过程中,积极开展数据产权问题研究探索,不断推进数据的所有权、使用权、经营权的明晰与权限管理机制的完善。开展数据及数据服务价值评估研究,以数据创新应用为导向分析影响数据价值释放的成本、技术等因素,从数据质量、数据规模、数据新鲜度、价值密度、交易频次、交易范围、应用溢价等因素,构建数据价值评估体系,加强数据服务的知识产权保护,开展数据流通、共享和交易机制和实施规则探索,促进数据要素共享、流通与应用。

加强数据共享关键技术支撑。围绕数据全生命周期和共享交换全流程,在传统ETL交换工具等基础上,以提升数据交换的实时高效性、全局性以及低成本、高质量为目标,重点加强触发式数据主动交换技术、异构数据清洗交换技术等应用;加强区块链技术在数据确权和追溯监管等环节的应用,提升数据使用的合法合规性;加强多方安全计算、联邦学习、同态加密等非对称加密技术应用,实现“数据可用不可见”,积极应用数据自动化脱敏、“阅后即焚”等相关技术,确保原始数据安全。

强化数据开放共享安全保障。建立健全产业大脑安全防护体系,落实网络安全等级保护制度,强化边缘层、平台层、应用层等网络安全保护;加强数据安全保障,构建一套贯穿数据采集、存储、共享、交易、使用、销毁等全生命周期的数据安全治理体系;加强数据脱敏与隐私保护,确保企业商业机密和基于敏感信息的正当权益;制定产业大脑安全保障管理规范和应急预案,定期开展网络与数据安全保护能力进行测评和监测,构筑数据安全防护屏障。

(作者单位:浙江省工业和信息化研究院 之江产经智库)

猜你喜欢
公共数据数据安全大脑
论公共数据管控权的规范建构
公共数据开放许可的规范建构
云计算中基于用户隐私的数据安全保护方法
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
大数据安全搜索与共享