【内容提要】个人数据安全一直是互联网平台治理中的重要议题,而随着“滴滴”等平台被查,国家数据安全问题也引发了公众的关注。今天的数据安全问题在互联网平台治理中有了双重意涵:个人数据安全和国家数据安全。由于互联网平台和云计算等数据处理技术的出现,一般个人数据与国家数据之间的“弱关联”在一定条件下会变成“强关联”,个人数据安全问题也可能转化为国家数据安全问题。针对这一情况,本文按照数据的生命周期,从收集、存储和使用三个维度提出了具体建议。
【关键词】个人数据 国家数据 互联网平台 数据安全
2021年6月30日,成立近9年的滴滴出行(简称滴滴)在美国纽交所上市,首日市值达到680亿美元。3天后,7月2日,国家互联网信息办公室(简称网信办)发布关于对滴滴启动网络安全审查的公告,以“防范国家数据安全风险,维护国家安全,保障公共利益”为由,对滴滴进行网络安全审查,并且暂停其新用户注册。7月4日,网信办再次发布通告,通知应用商店下架“滴滴出行”APP。
“滴滴事件”成为了我国自《网络安全审查办法》发布以来的首次公开审查行动,同时也拉开了网络安全审查的序幕。7月5日,网信办再次宣布对“运满满”“货车帮”“BOSS直聘”实施网络安全审查。
长期以来,个人数据安全一直是互联网平台数据安全问题的讨论重点。个人数据被违规收集和使用导致诸如个人信息泄露、“大数据杀熟”和数据黑灰产等问题频频出现,暴露出个人数据安全面临着严重的威胁。但随着滴滴等互联网平台被查,国家层面的数据安全问题也开始引发人们的广泛关注和讨论。今天互联网平台的数据安全问题有了双重意涵:个人数据安全和国家数据安全,而个人数据安全问题转化为国家数据安全问题的可能性也在加大。
一、大数据时代个人数据安全与国家数据安全关联的强化
根据《数据安全法》第二条,数据安全指的是通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。根据数据主体的不同,数据安全又可以分为个人数据安全和国家数据安全。在实践中,两者并非完全割裂开来的,在特定情况下存在着一定的关联。
依照数据持有者的不同,个人数据又可以分为重要个人数据和一般个人数据。前者指的是诸如政府高官、外事人员或其他涉密人员的个人数据,常与国家秘密或工作秘密重叠。①这部分数据带有国家属性,一旦被攻击、盗取或泄露,会直接损害国家利益并危害国家安全,因此与国家数据安全有着“强关联”。而绝大多数个人数据属于一般个人数据的范畴,其安全问题虽与个人权益息息相关,但以往与国家数据安全之间呈“弱关联”的状态,少量的个人数据不会对国家数据安全产生影响。然而,这一情况在大数据时代发生了转变。
随着大数据时代的到来,一般个人数据安全与国家数据安全之间的关系正在发生变化。在一定条件下,“弱关联”可以变成“强关联”。由于云计算等数据分析技术的发展,收集并处理大量的个人数据成为可能。云计算由智能逻辑和各种算法组成,是一种资源化的计算工具,只要完成数据导入就能实现对海量数据的分析。②通过云计算技术,一般个人数据同样有可能具备国家属性。数据的需求方可以通过对看似无用的一般个人数据进行分析,进而得出社会整体性数据,其中很可能存在涉及国家秘密、威胁国家安全的重要信息。从数据获取的难易程度来看,一般个人数据的收集难度较低。因此,一些有意收集国家数据的人可能会采用由个人数据分析出国家数据的路径,以达到获取国家数据的目的,这也意味着个人数据安全问题转化为国家数据安全问题的可能性加大。
但需要注意的是,零散的一般个人数据并不能实现向国家数据的转化,巨大的数据规模是转化的必要条件。因此,除了数据处理技术外,真正让这一转变成为现实还有赖于互联网平台在其中的作用。数据被称作“21世纪的石油”,其中蕴藏着丰富的商业价值,令商业组织可以分析得出有效的信息,为其发展提供指导。 ③因此,以逐利为目的的互联网平台才会大量收集和存储一般个人数据,使之在平台上聚集,形成较大的数据规模,进而威胁着国家数据的安全。如果说云计算是“弱关联”向“强关联”转化的技术条件,那么互联网平台则通过收集大量个人数据为转化提供了物质条件,成为了转化得以发生的中间平台。
以滴滴为例,其通过对用户产生的实时数据进行收集,形成了海量的数据规模。对此类数据的分析可以轻易了解某一城市的交通、医疗、行政资源的分布特征,进而掌握城市经济社会发展等各个方面的情况,其中可能产生涉及国家秘密、威胁国家安全的重要数据。④《网络安全法》第三十一条规定:国家对公共通信和信息服务、能源、交通、水利、金融、公共服务、电子政务等重要行业和领域,以及其他一旦遭到破坏、丧失功能或者数据泄露,可能严重危害国家安全、国计民生、公共利益的关键信息基础设施,在网络安全等级保护制度的基础上,实行重点保护。滴滴作为“关键信息基础设施”的运营平台,其被有关部门调查的原因正是由于所收集的一般个人数据经过分析处理可能产生“危害国家安全、国计民生、公共利益”的国家数据,带来严重的安全隐患。
对于一直与国家数据安全有着“强关联”的重要个人数据而言,其收集、存储与使用受到了严格的规范,诸如《保密法》等相关的法律法规对此类数据有着明确的规定。因此,重要個人数据受到了良好的保护,由此引发的国家数据安全隐患也得到了良好的控制。相比之下,对个人一般数据的保护更多停留在保护隐私安全的层面,并没有充分考虑到一般个人数据安全与国家数据安全之间正从“弱关联”转变为“强关联”的情况,忽视了一般个人数据导致国家数据面临安全威胁的可能。
二、如何防止个人数据安全问题上升到国家层面
正如上文所述,云计算等数据分析技术强化了一般个人数据安全和国家数据安全之间的关联,而平台收集的海量数据则为安全问题的升级提供了发生的条件。如何防止一般个人数据的安全问题对国家数据安全产生威胁,在此,笔者将根据数据的生命周期,从收集、存储和使用三个维度,提出一些应对思路。
(一)数据收集:“必要原则”
数据收集指的是从系统外部采集数据并输入到系统内部的过程,⑤也是数据生命周期中的第一环节。客观来看,互联网平台数据收集的规模越大、类型越多样,就越有可能通过分析海量数据而获得國家核心数据。这种过度收集的行为增加了一般个人数据安全问题威胁国家数据安全的可能。但在实践中,由于数据中蕴藏的巨大商业价值,以逐利为根本导向的互联网平台倾向于尽可能多地收集个人数据。以滴滴为例,其《个人信息保护及隐私政策》中将身份证号码、面目识别特征、录音录像、银行卡号、IP 地址等纳入到收集和保存的数据范围中,远超出滴滴核心功能所需要的数据。⑥
《网络安全法》第四十一条规定:网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则。《数据安全法》第三十二条则规定:任何组织、个人收集数据,应当采取合法、正当的方式,不得窃取或者以其他非法方式获取数据。综合两条法律,互联网平台在进行数据收集时应遵循“必要原则”,即互联网平台对个人数据的收集,不应超过其提供正常服务所需要的数据范畴。
落实“必要原则”应分为两步。第一,制定明确的数据收集范围,禁止平台收集时的“越界”行为。不同平台提供的服务类型不同,注定了其数据收集的范围有所差异。国家应依照提供服务的类型与平台运营的具体内容,明确其收集数据的范围。这个范围宜窄不宜宽,仅包含能够使平台核心业务正常运行的数据即可。对于非核心业务的数据收集则采取“分别提供”的方式,而不能捆绑打包,在初次使用时要求用户提供全部数据。第二,在明确范围后,由国家以相应法律法规的形式确定下来。由于个人相对于互联网平台处于劣势地位,缺乏同平台的议价能力,因此即使平台存在过度收集的行为,个人在大多数情况下也只能选择接受。只有通过国家的强制力对平台加以约束,才能让“必要原则”真正落到实处。
(二)数据存储:“数据本地化”与设置“存储期限”
在大数据时代,数据的规模呈指数型增长,与此同时,数据存储技术也飞速发展。2019年,阿里巴巴的数据存储规模就已经达到了EB级(1EB=1073741824GB)。正如舍恩伯格在《删除:大数据取舍之道》中所写:在前互联网时代,存储的成本非常高昂,遗忘是人类的常态;在数字时代,数字化带来“廉价的存储器、便捷的提取以及全球性的覆盖”,也让“遗忘已经变得昂贵而又困难,记忆反而便宜又容易”。 ⑦
对于互联网平台而言,廉价的数据存储成本让其收集的海量数据在理论上可以实现永久存储,并在此后通过分析手段加以使用。大数据分析技术能够在看似不相关的数据中找到关联,而随着数据规模不断扩大,互联网平台在使用数据时就会产生“滚雪球”效应,实现边际成本递减。由此,在数据存储阶段形成了“一次收集,无限存储”的数据存储方式。这种存储方式有利于平台获取利益,但却在客观上增加了个人数据安全转化为国家数据安全的可能。对此,笔者建议有二:第一,强化数据本地化,让“数据有条件出境”;第二,设定数据存储期限,避免“一次收集,无限存储”。
所谓数据本地化,指的是出于本国公民隐私保护、国家安全或执法便利等目的,在国家内部收集、处理和存储有关国家、公民或居民的数据。目前的数据本地化可分为三种:“完全禁止本国数据出境”“禁止本国特定数据出境”和“本国有条件数据出境”。⑧笔者认为,“本国数据有条件出境”既起到了维护国家数据安全的作用,又能尽量减少对于正常数据出境的阻碍,是当前我国应该采取的方案。该方案的核心在于“条件”的确定,对此,可以借鉴《数据安全法》中相关条款。
《数据安全法》首次以法律的形式对数据的分级分类保护作出明确要求,在第二十一条中规定:国家建立数据分类分级保护制度,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对数据实行分类分级保护。在实践中,平台应对个人数据进行分级分类管理,对于可能危害国家数据安全的个人数据实行本地存储;同时,允许不威胁国家数据安全的个人数据正常出境。例如,可以将平台中的个人数据分为涉密数据、重要数据和一般数据,⑨涉密数据严禁海外存储,重要数据在经过严格的审查并完成脱敏处理后可在海外存储,一般数据则不作存储限制。
此外,“一次收集,无限存储”的方式显然不合理,当数据基数与范围不断扩大,平台就具备了将相关数据进行整合分析的能力,容易由此勾勒出社会发展的真实图景,在客观上增加国家数据所面临的威胁。国家应着手给数据设定保存期限,避免个人数据在平台大规模汇聚,给国家数据安全造成隐患。对此,同样可以借鉴数据分级分类的思路,对平台收集的用户数据进行分级,依据其敏感程度设立保存期限,一旦到期就对数据做删除处理。对国家潜在安全威胁较大的数据应设定较短的期限,反之较长,而对基本不影响国家安全的数据也可以考虑取消期限设定。
(三)数据使用:限制数据的跨境流动
数据的经济价值在于使用数据,而不是占有数据,⑩平台收集和存储个人数据的目的正是通过使用增加自身收益。平台使用数据的方式有很多,其中可能导致个人数据安全上升为国家数据安全的主要是数据的跨境流动。所谓的数据跨境流动,指的是企业或机构将在所在国产生和收集的各类数据,提供给其他国家和机构的行为。11随着全球化水平的不断提升,互联网平台为了追求利益的最大化而积极开拓海外市场,这一过程中必然会导致数据跨境流动,让国家数据安全面临威胁。
有统计显示,在全球范围内至少已有135个国家或地区颁布了保护数据安全的法律法规,其中大多数对数据的跨境流动有着详细的规定。12在我国的《数据安全法》七章五十五条中,至少有11条直接涉及数据跨境流动问题。但需要注意的是,目前的《数据安全法》关于数据跨境流动的规定仍有不够完备之处。
第一,数据认定的主体不统一。《数据安全法》第二十一条第三款规定:各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。这其中将“各地区、各部门”都列为重要数据的认定主体,容易在实操环节造成标准不统一的情况,13在管理平台的数据跨境流动行为中出现多个管理者而导致效率低下和管理混乱。
第二,对重要数据的定义不明确。《数据安全法》第二十一条第二款规定:关系国家安全、国民经济命脉、重要民生、重大公共利益等数据属于国家核心数据,实行更加嚴格的管理制度。这其中提出了“核心数据”的概念,但却并未明确“核心数据”究竟有何特征、什么样的数据属于“核心数据”等具体问题。
从问题的关联上看,第二个问题其实是第一个问题的延伸,数据认定主体的缺乏很大程度上导致了无法明确什么是“核心数据”的问题出现。我国在2019年就将数据列入了生产要素的范畴,但相比于资本要素、技术要素等传统的生产要素,尚无一个国家级的数据主管机构对数据要素实施统一管理。14虽然我国已有了专门针对数据流动的法律,但仍缺乏专门管理数据跨境流动的部门。在“滴滴事件”中,网信、国安、公安、交通运输等七个部委对滴滴进行调查,出现了“九龙治水”的局面,正是源于缺乏专门负责数据跨境流动的部门。
为了避免此类效率低下且容易导致混乱的管理出现,国家应设定专管数据跨境流动的部门。一方面,该部门应在涉及数据出境的问题中发挥审查和监督的作用,防止数据在跨境流动的过程中影响国家安全;另一方面,该部门还应明确“核心数据”等重要概念,制定跨境流动数据的相关标准,这既方便在实践环节中依规办事,同时也有助于有数据跨境需求的平台开展自查行为,从而提升审查效率。
但需要注意的是,在防止个人数据安全上升为国家数据安全的过程中,应避免矫枉过正,因过度保护数据安全而影响其正常的跨境流动。保护数据安全的重要目的之一就是促进正常的数据流动,正如2019年G20大阪峰会上发布的“大阪数字经济宣言”所指出的:数据、信息、思想和知识的跨境流动产生了更高的生产率、更优质的创新和更好的可持续发展。15《数据安全法》中也体现了鼓励正常数据流动的思想,其中第七条规定:国家保护个人、组织与数据有关的权益,鼓励数据依法合理有效利用,保障数据依法有序自由流动,促进以数据为关键要素的数字经济发展。因此,对数据的保护需遵循适度原则,不能因噎废食,给数据的正常流动造成不利影响。
注释:
①姚斌.面向民法典的涉密人员个人信息特殊保护研究[J].保密科学技术,2020(07):63-69.
②周斌.大数据云计算环境下的数据安全问题分析[J].电子技术与软件工程, 2021(05): 245 -246.
③Nunan D.,Domenico M.. Market Research and the Ethics of Big Date[J].International Journal of Market Research, 2013(4):505-520.
④⑥韩洪灵,陈帅弟,刘杰,陈汉文.数据伦理、国家安全与海外上市:基于滴滴的案例研究[J].财会月刊,2021(15):13-23.
⑤⑧中国电子信息产业发展研究院.数据治理与数据安全[M].北京:人民邮电出版社,2019:第14页、第137-139页、.
⑦[英]维克托·迈尔-舍恩伯格.删除:大数据取舍之道[M].杭州:浙江人民出版社,2013:第119页.
⑨14谢永江. 论数据流通的治理机制[J]. 信息安全与通信保密,2021(7):19-27.
⑩[英]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:第156页.
11王斯梁,冯暄,陈翼.跨境数据流动场景中的网络安全保障研究[J].信息安全研究,2021, 7(07):682-686.
12张莉.《数据安全法》对数据安全风险设置“红线”[J].中国对外贸易,2021(07):34-35.
13许可.自由与安全:数据跨境流动的中国方案[J].环球法律评论,2021,43(01):22-37.
15数据人.G20发布《大阪数字经济宣言》(全文中译版)[EB/OL].https://www.sohu.com/a/326519514_500652,2021-8-20.
作者简介:徐辰烨,中国人民大学新闻学院博士研究生
(指导教师:彭 兰)
编辑:孟凌霄