迪莉娅
(燕山大学文法学院 河北秦皇岛 066004)
随着第四次工业革命的到来,数字技术的不断发展将创造一个更具包容性、创新性和弹性的社会,实现这一变化的核心是对“开放数据”的合理利用,利用数据进行管理、决策和服务将成为普遍的社会实践,而数据作为政府公共服务的变革性资源具有巨大的发展前景[1]。政府开放数据的主要目标之一是促进数据的合理利用、重复性利用和创新性利用,为数字经济的发展创造良好的发展环境。与政府开放数据相对应的是企业、非政府组织机构甚至是个人等主体对所收集的社会数据的开放。数据是新时代的“石油”,企业与各种社会组织机构和政府一样,都在有意识地收集、存储、加工和利用各种各样的数据,且掌握了社会大数据的重要部分,这些数据的价值较高,对提高政府管理、决策水平以及服务效率与质量具有重要作用。因此,超越传统政企合作的边界,融入更加多元的主体,例如非政府组织、高校、个人等所展开的“开放数据协作利用”将成为政府公共服务与治理的不二选择。因为这些数据不仅能为政府部门提供消费者、产品和市场趋势方面的相关信息,还能帮助政府机构解决公共服务问题[2]。
开放数据协作利用的维度主要包括两个方面,即基于公共服务的开放数据协作利用和基于商业利益的开放数据协作利用。文章主要聚焦学者们基于公共服务与利益对开放数据协作利用的研究,目前学者们对其含义的认识可以概括为以下几方面:①从应对风险角度定义。如学者Bram Klievink、Haiko van der Voort 和Wijnand Veeneman认为开放数据协作利用是旨在应对社会挑战而从事的跨部门协作收集、共享或处理数据的行为[3]379-397。②从协作目标角度定义。如学者Tom Kalil 认为开放数据协作利用是为了共享公共利益和使用数据而建立的组织之间的合作关系,其目的是从数据中获得见解并作出决策[4]。③从参与者角度定义。如学者Brice McKeever 等认为开放数据协作利用是指私有数据提供者服务于公共利益而共享其数据资产的行为,数据提供者可以是拥有、创建或收集数据的企业或其他组织,这些数据的发布可以采取多种形式,比如内部分析报告、向公众开放的数据集等[5]。④从合作关系角度定义。如学者Stefaan Verhulst 等认为开放数据协作利用是指公共部门与来自不同领域的机构、组织、个人为实现公共服务与利益,并基于数据利用而形成的一种新型合作方式[6]。
综上所述,学者们从不同角度和层面对开放数据协作作用的内涵进行了解析,笔者结合以上定义,认为其是指政府、企业、大学、非营利性机构、个人等多元主体基于数据共享和利用而形成的一种新型协作关系,其核心目标是实现公共服务和公共利益的最大化。
国外学者关于公共服务开放数据协作利用的研究开始得比较早,其内容主要包括以下方面:①基于公共服务开放数据协作利用概念和类型方面的研究。Stefaan Verhulst 等阐释了基于公共服务的开放数据协作利用的概念,并且将公共服务开放数据协作利用的方式分为数据合作和聚集、举办应用大赛、研究伙伴、开发智能产品、应用程序和委托信任中介等[7]。②基于公共服务开放数据协作利用的信任机制研究。世界经济论坛的研究报告认为,由于黑客、恶意软件以及私营领域数据滥用所造成的信任“赤子”是开放数据协作利用的主要障碍之一。因此,要加强基于公共服务的开放数据协作就需要协调经济利益、运营和治理之间的关系,有必要构建安全、负责任、透明、可审计、平等和符合道德准则的信任机制,以平衡数据保护需求、数据利用和创新之间的紧张关系[1]。③基于公共服务开放数据协作利用的框架研究。学者Erna Ruijer 设计了基于公共服务的开放数据协作治理框架,认为影响开放数据协作利用的因素包括组织机构的环境、协作动机与结构、协作过程的信任、透明度以及数据质量。除了以上因素之外,数据协作利用的领导力、冲突的解决、协作成果的应用等也对其有重要影响。④基于公共服务开放数据协作利用的创新研究。Bram Klievink 等[3]379-397以荷兰运输商为例,分析了开放数据协作利用中如何平衡各方目标的冲突与创新之间的关系,指出合作的历史和规则是开放数据协作利用的关键,而在协作过程中建立的信任关系和积极的信息反馈会促使协作形成制度化。⑤基于公共服务开放数据协作利用中的数据供需问题及利用机制研究。Stefaan Verhulst 等从数据供应方和需求方的角度对10个开放数据协作利用的典型案例和相关文献进行了分析,从14 个维度阐述了开放数据协作供需方面的问题与内容,提出开放数据协作利用不仅取决于组织的安排,还取决于政策问题类型、激励方式以及数据协作预期的成果等[6],并应用协作治理理论,从参与者、目标、活动、资源之间的依赖关系分析了开放数据协作利用的机制[8]。
虽然我国学者较少关注基于公共服务的开放数据协作利用方面的研究,但是学界对于商业化数据协作方面的研究已经开始,如对数据利用模式、数据权属界定和划分、数据商业化利用定价等方面的探讨,这些对基于公共服务的开放数据协作利用问题的研究具有重要参考价值和借鉴意义。
由于企业和各类社会组织的类型多样,其所生产和收集的数据涉及各行各业,例如教育、环境、社交媒体、卫生健康、能源等方面的数据,尤其是互联网企业拥有大量的用户个人信息、偏好和行为数据,若这些数据在保证安全和隐私的前提下,能实现以公共服务与利益为目的合理利用,则其将对政府决策、管理、服务创新产生重要价值。大数据时代,社会形势更加复杂、多变,占有更多数量、种类的数据是政府部门应对挑战和风险,进行科学决策、管理与服务的重要条件。基于公共服务的开放数据协作利用范式,将更多主体收集的数据纳入政府利用的范畴,不仅有助于促进公私合作,而且更加有利于政府数据和社会数据的开放,以促进基于开放数据协作式的利用、重复性利用和创新性利用。
公共事业是指服务于生产、流通和民众生活,由企业、政府、事业单位和居民共同享用各项事业的总和[9],涉及医疗健康、教育、交通等方面。社会数据的开放和利用,有助于加强公私合作,为公共事业的发展和创新提供有力支撑。例如,由美国国家卫生署与食物和药物管理局合作成立的药物合作促进项目(AMP)通过与各级政府、企业、非政府组织共享数据,致力于阿尔茨海默病、2 型糖尿病、类风湿关节炎和系统性红斑狼疮治疗药物的研发。项目的所有成员通过在线门户网站提供生物医学数据及其分析报告。该项目通过汇集公私领域的数据和专业知识,解决了制药行业数据和知识碎片化的问题,不仅大幅减少了药物研发的时间和成本,而且加快了医疗健康领域创新发展的速度[10]。
决策是政府的主要功能,决策基础是数据,如何获得全面且精准的数据是政府作出正确决策的前提条件。除了政府部门收集的数据之外,还应充分利用社会数据。包括企业数据、非政府组织机构数据,甚至是个人数据。以“政府+私营”的混合数据作为决策的支撑条件,明确决策者的改革方向,这有利于政府充分优化其决策方案,增强决策者的预测能力,帮助其规划和实施更加有效的公共服务措施[11]。
实践表明,开放数据协作利用可为预防、应对各类灾难、危害及灾后恢复和重建工作提供更加精准的方案和措施。例如我国的健康码就是由公安部门、医疗部门、海关、卫健委、铁路部门、电信部门、航空公司、社区与腾讯、阿里巴巴等公司合作,利用大数据技术的海量存储功能,接近PB 级的数据存储和扩容能力,并通过流计算实现实时跟踪以监控疫情[12]。其不仅可有效预防疫情的发生,还能对有疫情发生区域的病患和密接者进行精准施策,从而防止疫情的扩大和蔓延。
企业+政府机构的开放数据协作利用是指企业自愿将自己产生和收集的数据,在保证隐私和安全的情况下共享给政府,由政府部门将收集到的各类数据应用于以开展公共服务、社会福利和社会救助等为目的的公共事业当中。例如推特(Twitter)公司应用程序接口(API)会定期面向政府和公共服务机构发布一定的数据样本。通过这些数据,公共服务机构可以了解社交媒体用户关注的话题类型、内容及与其离线行为的关系,对于应对重大事件,例如自然灾害、选举活动等方面的舆情具有重要作用。在获取数据方面,推特公司除了在查询和搜索数据方面设有一定的限制之外,需求机构只用登录账户就可以充分利用这些数据[13]。这一类型的数据协作,通常是由企业或者组织机构、个人将部分数据共享给政府或者社会公众,属于典型的数据“慈善”行为。
该类型的开放数据协作通常是由企业设立专门的研究项目并与高校和研究机构合作,充分利用政府数据和社会数据为公共利益服务。例如Facebook 成立了CommAI 访问研究项目,邀请相关大学、实验室等的研究者参与到机器学习的合作研究当中,并出版了相关研究报告和开源代码。该项目对机器学习方面的研究实现了政府、研究机构与Facebook 的合作共赢,一方面可以推动人工智能在政府、企业中的应用,另一方面还可以改善Facebook 的内部算法和数据分析流程[14]。
这种开放数据利用,通常以中介为桥梁展开公私合作,通常分为以下两种类型。
企业将数据委托给信任的中介机构进行基于公共服务目的的利用。例如由哈佛大学定量社会科学研究所主持的社会科学一号(Social Science One)项目为了促进商业和社会数据的利用,在保证隐私和安全的前提下,通过信息共享、项目示范与合作等方式,减少行业数据协作利用过程中存在的障碍,积极推进学术界、有关机构和企业参与到以实现公共服务为目标的事业当中。该项目还利用微软和Facebook 的数据与很多企业进行合作,创建了“Facebook URL 数据集”,该数据集包含社交媒体对选举和民主影响的数据,为学术机构提供Facebook 页面浏览量和政治广告库流媒体的API 等,并与微软建立了开源隐私保护软件开发方面的合作关系[15]。
由政府部门成立专门的中介机构对接企业数据利用。例如英国经济和社会研究委员会成立了消费者数据研究中心(CDRC)作为中介机构,将与消费者相关的企业,例如零售业、交通、银行收集的数据在保证安全和隐私的前提下提供给相关研究机构使用,通过对消费者消费数据的类型、内容、方法等的研判,为政府实施救济、管理提供依据。CDRC 与利兹数据分析研究所、利兹大学的地理学院合作,从空间地理的角度分析消费者的脆弱性,对企业和政府部门加强营销管理与开展保护消费者权益的服务方面具有重要的参考价值。由此可见,这种来自多个不同部门、行业的数据集,具有来源广泛且内容丰富的特点,经过交叉分析可为高度复杂、高难度问题的解决提供重要途径和方法[1]。
少量企业向社会开放数据。目前,我国已有少量互联网企业开始将收集和产生的部分数据向社会开放,以优化相关领域的服务与决策方式,推进产品开发。例如淘宝将其数据分为两个层面进行开放:其一,免费开放的数据。主要包括电子商务行业的宏观数据,以及有关消费者消费风向标的数据;其二,商业式开放的数据。在高度保护消费者隐私和商业秘密的前提下,对涉及各个行业市场情况、消费者行为等方面的数据采用收费或者交易方式的开放[16]。但从整体而言,绝大多数的企业还没有意愿将其收集的数据向社会开放。
政府以项目的形式与企业进行开放数据的协作利用。即政府通过项目资助的形式,将产业发展项目委托给企业进行研发和创新。例如,京东承担的基于电子商务全产业链大数据的创新创业服务就是“国家促进大数据发展重大工程”的支持项目。该项目利用京东全产业链大数据的基础优势,在人工智能、零售创新应用服务、信息共享、新模式发展等方面打造全球领先的智能商业体,并通过数据共享与开放、自主创新、产业实践带动整个行业的发展,同时为农业、工业、零售业、金融业等相关产业提供强有力的跨行业数据分析服务,为新业态、新模态的价值创造提供平台[17]。
开始重视数据中介的桥梁作用。数据中介是为用户采集、加工或者处理数据,为其提供数据信息来源或者搭建数据供给桥梁的组织机构。数据中介在促进开放数据的利用与创新性利用方面具有重要作用,其对数字经济的贡献不容小觑。有报告显示,2020 年全球数据中介市场的价值为246.09 亿美元,预计2021 至2027 年期间年复合增长率为4.3%,在2027 年达到近365.17 亿美元[18]。
目前我国数据中介机构的发展还处于起步阶段,规模不大,但势头良好。①政府成立大数据管理局以推进政府开放数据的利用和交易。有关数据显示,目前我国有17 个省(直辖市)、203 个市(州、盟)组建了专门的大数据管理机构。这些机构的功能之一是统筹管理政府数据,通过自上而下的整体性部署与一体化建设推动政府数据的开放、融合、共享以实现其价值。通过大数据局管理加强政企合作,是促进数据实现其价值的重要方式之一[19]。②制定中介服务的政策。例如2021 年广州市在海珠区首次开展数据经纪人试点工作,并出台了《广州市海珠区数据经纪人试点工作方案》,此举措发挥了数据中介机构的数据汇聚优势,充分释放了数据红利,有效促进了数据新要素的有效流通和数据新业态的构建[20]。③聚焦数据中介交易产业体系的建设。2022 年北京国际大数据交易所建立了首个数据交易中介服务产业体系,致力于构建包括数据收集、加工、确权、评估、定价、审计、交易等新型数据要素在内的交易服务体系[21],通过对接数据资源、开展中介服务、撮合进场交易等方式,促进数据可信、有序流通和市场化利用,加速数据与经济活动的融合[22]。
当前,我国政府部门还没有充分认识到开放数据协作开发利用的重要性。自2012 年我国地方政府开放数据以来,数据开放已取得了一定进展。《中国地方政府数据开放指数(2021 上半年)》报告显示,截至2021 年4 月底,我国已经有174 个省级和城市的地方政府上线了数据开放平台,其中省级平台18 个(含省和自治区,不包括直辖市和港澳台),城市平台156 个(含直辖市、副省级与地级行政区)[23]。政府开放数据的主要目标之一就是促进其利用,政府不仅为企业利用数据创造了良好的营商环境,而且为企业利用数据进行创新以促进新业态、新模态的发展提供了大力支持。然而,政府部门虽已认识到政府开放数据对于数字经济发展的重要性,但还没有充分认识到企业数据、非营利性组织机构数据、个人收集数据的协作利用对于公共服务建设与发展的重要性,因此绝大多数政府机构没有建立数据利用常态化的机制。整体而言,我国公共服务开放数据协作利用状态还处于零散、碎片化的阶段。
企业数据共享和开放的力度不够。在社会数据开放利用中,企业数据的开放和利用占有主导性的地位。企业之所以不愿意积极主动开放数据为社会所利用,一方面是由于主体性质的差异,政府作为典型的公共服务主体,其有开放数据的义务;而完全不具有公共属性的市场主体是私主体,其开放数据秉承自愿的原则。因此,开放主体属性的差异性导致数据开放的范围、模式等方面也会存在差异性[24]。另一方面,在大数据时代数据本身是企业的核心资产和竞争力,开放数据虽然有利于企业生态环境的改善,但对其核心竞争力是否会产生不良影响同样成为很多企业的主要顾虑。
隐私顾虑和安全顾虑。私营领域数据开放和政府数据开放一样,都面临着隐私顾虑问题。正如有学者所言,淘宝上的个人消费数据到底是属于个人还是属于企业的权属之争问题不解决,个人隐私保护就始终面临着重大挑战[25]。以企业为例,在企业收集、生产的数据中,包含了大量的个人信息,这些个人数据中既有个人的姓名、地址、银行卡、身份证号、出生日期,也有涉及个人消费和交易行为、信用等方面的信息。如何正确利用个人数据,需要企业把握好个人隐私保护和利用之间的尺度和界限,以及对数据利用过程中出现的数据泄露或者滥用、误用等问题的责任划分和问责等。除了隐私顾虑之外,企业同样还有安全方面的顾虑,例如在利用数据的过程中有可能会泄露商业方面的敏感数据、商业秘密,甚至还会遭遇网络攻击等问题[26],这些顾虑也是影响企业向政府和社会开放和利用数据的重要因素。
缺乏有效的数据开放激励措施。虽然基于公共服务的开放数据协作的类型正在逐步多样化,但数据利用的效果并不显著。如前文所述,目前我国除了少量企业主动向社会开放数据,部分政府资助的企业利用数据从事公共服务领域的项目开发之外,数据中介模式更多聚焦于开放数据如何向社会开放和进行商业化利用等问题,对政府利用私营领域数据方面缺乏重视。因此,政府部门有必要建立相关体制机制,实施长效的激励方法和措施,以促进社会数据的大幅度开放和利用。
2019 年中共十九届四中全会通过的《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题决定》及2020 年国务院办公厅印发的《公共数据资源开发利用试点方案》等一系列政策都对我国政府数据的深度开放和利用起到了积极的推动作用。与此同时,地方政府也积极响应,浙江省出台了《浙江省数字经济促进条例》(2020 年)、广东省出台了《广东省数据要素市场化配置改革行动方案》(2021 年)和《广东省首席数据官制度试点工作方案》(2021 年)、深圳出台了《深圳经济特区数据条例》(2021 年)、山东省出台了《山东省大数据发展促进条例》(2021 年)、海南省出台了《海南省公共数据产品开发利用暂行管理办法》(2021 年)等地方政策与法规,这对政府开放数据创新性利用的制度建设、权属的划分和应用场景的落地等具有重要的指导作用。
目前国家和地方的政策主要聚焦于政府开放数据市场化配置、利用等问题,而对政府本身如何充分利用社会数据以提高其管理与决策服务水平和能力方面重视不足。因此,在大数据时代,政府部门须常态化开展数据利用方面的培训与学习,以提升参与主体的数据素养并推动政府和社会数据的开放和利用。
日新月异的现代技术给社会带来了巨大、潜在的风险,现代化社会和科技的发展越超前、越成功,风险问题便会越突出和发生得越频繁[27]34。在高度复杂的大环境下,只有政府、企业、非营利性组织、研究机构、专家、公民等多元力量通力合作,才能大幅度控制和预防高风险的发生[27]35。此外,由于政府是应对社会风险和公共事务管理的主导主体,因此建立数据驱动的政府管理与服务机制必不可少。虽然开放数据本身存在一定的风险,但是如果不能充分利用数据来对其进行预防,那么由此产生的风险可能会远远超过开放数据本身。因此,数据开放不仅仅指政府数据开放,而且也包括社会数据的开放,即企业、非营利性组织、教育机构等数据的开放。只有开放才更有利于数据实现全面、多层次的融合与利用,从而创造出更多、更好、更丰富的产品和服务。
法律和伦理都是调整社会关系和人们行为的重要机制,“法德并举”是时代的必然要求。目前,为了保护信息社会中的个人隐私和数据安全,我国相继出台了多部与数据安全利用相关的法律,例如《网络安全法》《数据安全法》《个人信息保护法》等,为数据利用中的隐私保护和数据安全提供了重要的法律保障,但与之相关的伦理框架与政策阙如。早在2017 年国务院在《新一代人工智能发展规划》中就提出,要建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力[28],而人工智能应用的核心元素之一就是数据的利用。因此,为了深入推动数据的开放和利用,减少数据开放主体对隐私和数据安全方面的各种顾虑,我国有必要制定数据利用相关的伦理政策,提高数据利用的透明性、公平性,以增强数据协作利用过程中多元主体的信任并加强合作。
公共服务开放数据的协作利用不以营利为目的,属于公益性质,很多企业和非营利性组织在危机和风险发生过程中,通常会免费为政府机构提供数据。但在常态化的管理与服务中,企业和社会组织机构收集的数据都有一定的采集、存储、维护等方面的成本,如果让企业、非营利性组织机构长期化、常态化地提供数据为政府所用,就需要为其建立基于成本补偿的数据利用方法或者在税收与补贴方面给予优惠等,鼓励企业和社会机构积极参与到公共服务开放数据协作利用当中。
(来稿时间:2022 年5 月)