梅宏
近年来,围绕大数据治理这一主题及其相关问题,国际上已有不少实践和研究探索工作。诸如在国家层面推出促进数据共享开放、保障数据安全和保护个人隐私的相关政策和法规,针对企业机构的数据管理能力评估和改善,面向数据质量保证的方法与技术,促进数据互操作的技术规范和标准等。那么,我国应该如何在推动大数据治理体系建设中,更好地保护个人隐私,为大数据产业的发展营造良好环境?
党的十九大报告提出:“推动互联网、大数据、人工智能和实体经济深度融合。”在我国全面实施国家大数据战略、构建数字经济、建设数字中国的大背景下,回顾大数据发展的历程、认知大数据发展的现状、把握大数据发展的趋势,对明确我国大数据发展的重点方向和发力点十分必要。
数据作为基础性战略资源的地位日益凸显
“大数据”概念从计算领域发端,并迅速应用到科学和商业领域,其巨大价值和潜能逐渐被全社会所普遍认知,一大批企业、开源基金以及风险投资纷纷进入到大数据领域,大数据产业生态也在此时逐渐形成。
纵观国内外大数据产业生态的发展,我们不难发现其发展重点随时间推进而不断演进。
大约在2012年到2013年,大数据领域最具影响力的技术和产品主要围绕数据汇聚、存储、处理等基础技术和基础设施展开。
2014年至2015年前后,经过前期发展,已经形成了一批针对特定应用场景的大数据管理和处理等问题的解决方案,而同期数据驱动的人工智能取得突破性进展,人们分析数据、从数据中萃取信息、知识和智能的热情高涨,数据分析方法、技术和产品与相关企业成为了这一阶段大数据生态系统中最为活跃的部分。
2016年,虽然大数据技术还远未成熟,但是体系已经渐趋完整,与传统产业、行业的结合也日益紧密,面向行业和领域的大数据应用与相关企业发展迅猛,成为新的焦点,大数据生态系统也更加成熟。
2017年之后,随着大数据在各个行业领域应用的不断深入,数据作为基础性战略资源的地位日益凸显,数据确权、数据质量、数据安全、隐私保护、流通管控、共享开放等问题日益受到高度关注并引發深度思考。
学术界和产业界均意识到,大数据一方面给现有信息技术体系带来了系列挑战,需要研发投入和创新发展,另一方面,还需要营造有利于大数据产业健康有序发展的良好环境,为此,大数据治理的概念受到关注,成为大数据产业生态系统的新热点。
大数据治理存在的三个主要问题
笔者纵观当前国内外的研究和实践,认为大数据治理目前仍存在三个方面的主要问题:
一是大数据治理概念的使用相对“狭义”,研究和实践大都以企业组织为对象,仅从一个组织的角度考虑大数据治理的相关问题。大数据治理的范围仅限于组织内部显然是不够的,多源数据聚集和跨组织、跨领域的数据深度融合挖掘是展现大数据价值的前提,在价值驱动下,各界普遍存在着数据突破组织边界流动的需求。随着数据开放和流通技术及渠道的逐步完善,数据跨组织流动和应用已经发生,并呈现日益普遍趋势。无疑,这将是涉及行业内和跨行业、区域内和跨区域、全国乃至全球多个层次的问题,企业组织的大数据治理离不开行业的规范和自律、国家的“上位法”甚至国家间的约定或协议,多层次协同才有可能构成大数据生态建设的基础性保障。
二是现有研究实践对大数据治理内涵的理解尚未达成共识。不同的人结合大数据的特征,从企业业务和管理流程设计、组织信息治理规划、组织数据管理与应用等不同的视角,给出了大数据治理的不同定义。比如有的人将大数据治理定位为描述数据如何在其全生命周期内有用及其经济管理的组织策略或程序,有的人定位于企业对数据可获性、可用性、完整性和安全性的措施及其全面管理,有的人则着重于制定与大数据有关的数据优化、隐私保护与数据变现的政策……共识的达成有待时日。
三是大数据治理相关的研究实践多条线索并行,关联性、完整性和一致性不足。诸如,国家层面的政策法规和法律制定等较少被纳入大数据治理的视角;数据作为一种资产的地位仍未通过法律法规予以确立,难以进行有效管理和应用;大数据管理已有不少可用技术与产品,但还缺乏完善的多层级管理体制和高效管理机制;如何有机结合技术与标准,建立良好的大数据共享与开放环境仍需要进一步探索;除了不断完善发展相关技术以应对各种新型攻击挑战外,企业安全保障制度、行业自律监管机制和国家通过法律确定的强制手段还有待完善;没有系统化设计,就可能导致已有相关体系的扩展和延伸出现数据治理的碎片化和一致性缺失等问题。
在构建数字经济、建设数字中国和网络强国的进程中,大数据不仅仅是新经济的关键要素,更关乎国家安全和国家综合竞争力。一国拥有大数据的规模、数据的活性以及对数据的理解和运用能力,将决定其对世界局势的洞悉度、影响力和主导权。因此,大数据治理必须跳出单个组织的边界,从营造国家大数据产业发展环境的视角予以全面、系统化考虑。
大数据治理体系建设需国家、行业和组织共同发力
基于已有研究和实践,笔者认为,大数据治理体系建设涉及国家、行业和组织三个层次,包含资产地位确立、管理体制机制、共享开放、安全与隐私保护等四项内容,需要从制度法规、标准规范、应用实践和支撑技术方面多管齐下,提供支撑。
国家层次:需要在法律法规层面明确数据的资产地位,奠定数据确权、流通、交易和保护的基础;需要兼顾现状及发展,建设适合国情的良好的数据管控协调体制和相应的管理机制;需要制定促进数据共享开放的政策法规和标准规范,实现政府部门间的数据共享,规范市场主体间的数据流通和交易,建设政府主导的数据开放平台,促进政务数据和行业数据的融合应用;需要出台数据安全与隐私保护的法律法规,保障国家、组织和个人的数据安全。
行业层次:行业大数据治理应在国家相关法律法规框架下,充分考虑本行业中企业的共同利益与长效发展,构建相应的行业大数据治理规则。需要建立规范行业数据管理的组织机构,制定行业内的数据管控制度;需要制定行业内数据共享与开放的规则和技术规范,构建行业数据共享交换平台,为本行业企业提供数据服务,促进行业内数据的融合应用;需要制定行业内数据安全保障制度,确保行业内每个成员单位的数据安全、权益和商业秘密。
组织层次:需要通过组织内部规章将数据确定为其核心资产,以利于有效管理和应用;需要建立适应数据资源完善、价值实现、质量保证等方面的组织结构和过程规范,提升企业对数据全生命期的管理能力;需要促进企业内部部门间的数据共享,并加强对外的数据流通和交易,充分盘活数据价值;需要结合“上位法”及自身的管理和技术措施,保障企业自身的数据安全及客户的数据安全和隐私信息。
在这个大数据治理体系框架中,三个层次相互关联和支撑。国家层次制定大数据治理的“上位法”,指导和监管行业及组织的大数据治理;行业层次通过行业自治的模式,在自愿原则上形成行业协会或联盟等,作为政府和企业之间的桥梁,在国家法规和政策的指导下,制定并执行行规行约和各类标准,监督企业的行为,并向政府传达企业的共同需求;组织则在国家和行业大数据治理的框架下,针对自身的特点,确定大数据治理的目标,优化对大数据资源的管理,最大化从大数据中获得收益。