王伟玲
当前,以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透,以数据为核心的数字化转型已是大势所趋。各行各业在生产经营过程中积累了海量的数据资源,只有做好数据治理,才能更快、更好地推进数字化转型。
当前,新一代信息技术蓬勃发展,我国正处于以科技赋能实现大发展、大变革的关键时期。以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透,以数据为核心的数字化转型已是大势所趋。要深刻认识数据资源对数字化转型的重要意义,切实把数据规划好、管理好、保护好、应用好,深挖数据价值,释放数据潜能,推动经济社会实现高质量发展。各行各业在生产经营过程中积累了海量的数据资源,只有做好数据治理,才能更快、更好地推进数字化转型。
一、数据治理之“困”
(一)数据底数不清
“数据要素市场”的提出,让更多人意识到数据的重要性,有望加速数据资产化进程。任何组织推动数据变成资产前,都需要先摸清数据家底,否则数据资产化将无从谈起。放眼望去,数据底数不清却是目前我国数据要素市场面临的普遍问题。究其原因,以往系统建设规划往往只针对特定业务需求设计,缺乏对全局数据的通盘考虑。对于一些大型的组织来讲,数据涉及的系统数量往往达数百个,支撑的数据库达上千个。随着系统使用时间的增加,庞杂的数据无序地分散在不同系统中,对于数据价值的释放带来极大困难。开展数据分类分级治理,建立数据台账,摸清数据底数,是数据资产化的前提,更是数据要素市场发展的第一要务。
(二)数据安全防护水平有待提升
数据安全是关乎组织生死存亡的核心要素。数据要素市场发展伴随着海量数据的汇聚、流通和使用,如果没有可靠的数据安全防护,很容易受到不法分子的攻击和窃取。我们从近年来不断上演的数据泄密事件中即可窥见一斑。威瑞森《数据泄露调查报告》显示,2019年全球86个国家共发生41686起安全事件和2013起数据泄露事件,使得相关机构蒙受巨大损失。IBM《2019年全球数据泄露成本报告》显示,近5年来数据泄露的年平均成本已达392万美元。开展数据安全治理,平衡数据流通使用与个人信息保护及数据安全之间的关系,加大数据安全保护力度,确保数据要素市场得以有效运行。
(三)数据质量不高
数据质量的高低将对数据结果有效性具有决定性影响。数据质量不高,不仅会使分析结果与实际产生很大偏差,甚至有可能引发灾难性后果,可谓“失之毫厘,谬以千里”。例如病患的病史和健康数据不准确,为患者提供的药物建议就可能出现严重错误。同样,如果支撑企业决策的数据不准确,将导致企业经营管理偏离预期战略目标。
如果将数据比喻成水,有效的数据就是饮用水,为生命提供源动力;无效的数据就好比脏水,给人体健康带来伤害,严重时甚至危及人的生命。开展数据质量管理,对数据产生、采集、存储、流通、应用和销毁的全生命周期进行质量管控,提高数据质量,是保障数据价值实现的现实需要,也是推动数据要素市场发展的必由之路。
二、数据治理之“道”
面对上述困难和挑战,如何解困破局、实现数据有序治理和高效利用,是需要共同探讨的重点议题。因此,数据治理应遵循四大基本原则。
首先,依法合规,保障安全。
数据作为重要的生产要素,确保数据安全应是始终恪守的底线。尤其是对信息安全高度敏感的行业,应建立健全数据安全管理长效机制和防护措施,严防数据泄露、篡改、损毁与不当使用,依法依规保护数据主体隐私权在数据治理过程中不受侵害,不能因开展跨部门数据融合应用而突破现有法律法规与监管规则。
其次,物理分散,逻辑集中。
由于历史原因,很多机构往往存在“N”个数据中心(数据源),呈现出多个业务数据分散存储、分散运行的局面,若采用“推倒重来”的方式显然成本太高、阻力太大。因此,应在保持现有数据中心职能不变的前提下,维持当前数据物理存放位置和运行主体不变,充分利用各数据中心IT设施和人才资源,构建“1个数据交换管理平台+N个数据中心(数据源)”的数据架构格局。在此基础上,制定实施统一的数据管理规则,实现数据的集中管理。
再次,最小够用,用而不存。
数据治理的一大难点就是如何在保障数据所有权基础上实现数据的融合应用。应消除数据所有方因信息“控制权让渡”造成“事权转移”的顾虑,规范数据使用行为,严控数据获取和应用范围,确保数据专事专用、最小够用、未经许可不得留存,杜绝数据被误用、滥用。在满足各方合理需求的前提下,最大限度保障数据所有方权益,确保数据使用合规、范围可控。
最后,一数一源,一源多用。
当前,无论是教育行业还是工业企业,各业务线数据分散现象或多或少存在,数据多头收集时有发生。这不但增加信息报送、采集、存储成本,也导致数据责任主体不明,数据安全、数据质量难以保障。应明确源数据管理的唯一主体,保障数据完整性、准确性和一致性,减少重复收集造成的资源浪费和数据冗余。同时,建立数据规范共享机制,提升数据利用效率和应用水平,实现数据多向赋能。
三、数据治理之“术”
就如何做好数据治理工作,提出如下四点意见。
其一,以顶层设计为契机点,推动数据规划从“美好蓝图”走向“生动现实”。
数据治理是一项长期、复杂的系统工程,要在组织、机制和标准等方面加强统筹谋划。一是优化组织架构。充分认识数据的重要战略意义,将数据治理纳入企业中长期发展规划,及时调整组织架构,明确内部数据管理职责,理清数据权属关系,自上而下推动数据治理工作。二是完善应用机制。在保障各方数据所有权不变前提下,统筹规划全局数据架构,完善跨机构、跨领域数据融合应用机制,实现数据规范共享和高效应用。三是构建标准体系。建立涵盖數据采集、处理、使用等全流程的标准体系,打造数据的“通用语言”,提升数据质量,为数据互通、信息共享和业务协同奠定坚实基础。
其二,以数据管理为着力点,推动数据要素从“杂乱无章”跨越到“纲举目张”。
一是做好数据资产管理。根据统一的数据标准体系,建立全局数据模型和科学合理的数据架构。在此基础上,管理维护全局数据资产目录,实现对数据资产的全面梳理和有效管控,解决数据质量不高、数据利用不足等问题。二是做好数据分级管理。综合国家安全、公众权益、个人隐私和企业合法利益等因素,制定数据分级标准,基于全局数据资产目录将数据进行分级。针对不同等级数据采取差异化的控制措施,实现数据精细化管理。三是做好数据共享管理。规范数据共享流程,确保数据使用方在依法合规、保障安全前提下,根据业务需要申请使用数据。数据所有方按规则审核确定数据使用范围、共享方式等,通过数据交换机制实现数据有序流转和安全应用。
其三,以数据安全为关键点,推动数据安全从“被动防御”跨越到“攻防兼备”。
要遵循“用户授权、最小够用、全程防护”原则,充分评估潜在风险,把好安全关口,加强数据全生命周期安全管理,严防用户数据的泄露、篡改和滥用。在采集环节,要向被采集用户进行明示,明确告知数据采集和使用的目的、方式以及范围,在获取用户授权后方可采集。在存储环节,通过特征提取、标记化等技术将原始信息进行脱敏,并与关联性较高的敏感信息进行安全隔离、分散存储,严控访问权限,降低数据泄露风险。在使用环节,借助模型运算、多方安全计算等技术,在不归集、不共享原始数据前提下,仅向外提供脱敏后的计算结果。
其四,以数据应用为切入点,推动数据要素从“明珠蒙尘”跨越到“连城之璧”。
数据治理的核心环节是数据应用,要从算力、算法、存储、网络等维度加强技术支撑,切实增强数据应用能力。在算力方面,加快分布式架构转型,充分发挥云计算等技术高性能、低成本、可扩展的优势,满足海量数据分析处理对计算资源的巨大需求。在算法方面,基于深度学习、神经网络等技术设计数据模型和分析算法,提升数据洞察能力和基于场景的数据挖掘能力,为数据插上翅膀,让数据在经济社会各领域展翼翱翔。在存储方面,探索与互联网特征相适应、与信息安全要求相匹配的数据存储方案,稳步推动分布式数据库应用,实现数据高效存储和弹性扩展。在网络方面,运用物联网技术丰富数据采集维度,利用5G技术高带宽、速度快、延时低等优势提升数据流转效率,打造数据“高速公路”。
当前,新一代信息技术蓬勃发展,我国正处于以科技赋能实现大发展、大变革的关键时期。要深刻认识数据资源对数字化转型的重要意义,切实把数据规划好、管理好、保护好、应用好,深挖数据價值,释放数据潜能,推动经济社会实现高质量发展。