论智能算法时代下的个人数据保护

2022-11-13 12:06陈宇超陈宇卓

对外经贸 2022年2期

陈宇超陈宇卓

（1.上海对外经贸大学法学院，上海 200000；2.桂林理工大学旅游与风景园林学院，广西桂林 541000）

一、算法数据获取概述

（一）问题的提出：智能算法对信息保护带来全新挑战

人工智能算法在网络领域广为应用，相关程序下载安装后若想要使用，就必须同意服务商所预先拟定好的协议，其中包括获取与程序功能本身并无关联的通讯录、短消息等信息权限。相关程序运行时，不仅通过收集用户的搜索历史、浏览内容等信息来定期推送关联广告，而且也会将用户的偏好信息传递给其他同类或关联应用程序。甚至存在即使没有打开该应用程序，其本身也会自动收集用户日常交流中内容的情况，软件会对关键内容进行提取，待用户下次启用App 时予以广告推送。公共领域中，部分商场、车行会依据店内安装的摄像头，借助网络、人像识别、大数据等技术知晓某位客户之前去过的商家、来店次数、购买历史等信息，以此区别对待，提供不同的服务。

“智造时代”，在数据驱动的经济中，个人信息通常被认为是“免费”的数字服务，同时客户数据已经被视为商业资产。算法以及人工智能的应用的确使用户更方便地获取到信息，对网络服务商来说也提高了推送效率。但这种近乎强制的服务条款、不加限制的网络公司之间的信息共享制度、难以发觉的信息获取手段也使公民个人隐私保护受到新式威胁。

算法侵权的对象是公民的个人数据或个人隐私。我国《网络安全法》第76 条第五款、《个人信息保护法》第四条第一款、美国SP 800-122《保护个人身份信息的保密指南》等法条都将判断个人信息的关键规定为信息是否具有与个人身份之间的特殊关联性。但这种关联性其实属于一种强关联性。而网络环境下，个人数据的范围正呈现一种扩大化的态势，网络服务商获取的信息用途并不一定能够直接或间接与用户身份相匹配，即用户的个人具体身份属性并不一定是服务商想要获取的内容，而其关注的是用户搜索习惯、浏览爱好等，这种弱关联性能否被现有法条所囊括至关重要。

（二）算法数据获取的特点

1.授权强制性

一般在应用程序首次使用时，程序取得用户信息使用许可有两种方式：一是在登陆时要求用户同意相关服务协议，在服务协议内部设有专门的信息获取条款，用户在勾选同意协议即代表对内部所有规定的同意；二是在首次进入程序内部后，系统会自动弹窗直接要求取得相关功能的权限如通讯录、相机、短信等。无论是哪一种形式，服务商对于信息获取都没有做到足够的提醒义务，在第一种服务协议模式里，服务协议条款过于复杂冗长，但涉及用户信息获取的内容并没有做到明显有效的标注，并且用户通常为了使用该应用程序也几乎不会点开协议链接查看具体内容；而第二种形式中更是只说明要求取得手机相关功能的授权，却没有说明获取信息的授权。当然其中最关键的还是如果用户不同意服务协议或拒绝授权相关功能使用，就会导致用户无法使用该应用程序或导致程序直接退出。在公共领域，几乎无处不在的摄像头更是不会经过他人同意就能够获取他人的人像、位置等信息，不存在需要获取对象的授权且实际应用当中也的确无法设置相应的授权程序，这种不加约束的信息获取已经远远超出了一般自然人能够控制和约束的范围。

2.途径隐秘性

传统侵害隐私权的形式较为单一，比如未经允许私自进入他人生活、工作空间，通过偷窥、跟踪等方法获取他人信息、隐私。其需要行为人通过切实地与获取对象或获取对象的信息接触才能够取得。与传统收集个人信息的方式不同，人工智能通过各种端口侵入个人生活，收集个人信息。会在用户使用过程中凭借已经获得的权限，直接拉取手机系统存储、应用程序使用记录等信息。上述过程不仅用户无法发现，系统也不会有任何提醒。另一方面，公共场所内的摄像头通过网络与中央计算机连接，不仅能够知晓目标的位置、人像，还能够使用计算机算法与数据库中的既有信息进行匹配，以获得关于目标的更多信息。通常情况下，即使发现摄像头的存在，但对其是否会获取自己的信息以及获取的内容、时间等均不得而知。相比传统信息获取方式，在网络和算法的加持下，信息的选择、收集、匹配、分析、储存等程序十分完备，计算机运算速度的提高也使得整个过程更加高效，同时所有的流程都在后台完成，这种远程的、虚拟的或是无接触的手段也使其更加难以被察觉。这就意味着，此类侵权手段造成的实际侵害时间更长、影响更大，纠纷解决时的举证证明也会更加困难。

3.获取内容广泛性

内容广泛性包括获取到的信息形式广泛性和侵权领域的广泛性两方面。一方面，智能算法能够收集的数据并不局限于一般的文字形式，声音、图片、视频等多种类型信息都已囊括其中，更重要的软件还能够通过算法的识别、分析等处理后将其包含的内容反映出来。另一方面，虽然网络服务提供商可以在不损害他人合法利益的情况下，通过算法的使用来为用户提供更优质好的服务，或与政府部门建立相应的系统保护公民人身、财产安全。但移动支付在国内的普及使个人信息与银行卡直接绑定，通过取得用户信息就可以直接进入支付平台，这与线下侵权需要实际取得银行卡及所有人的身份证明具有明显不同。用户信息和多种互联网金融平台、信息存储中介的紧密关联导致信息泄露内容已不仅仅是日常隐私的范围，更可能会涉及财产权领域。

二、算法应用下的具体侵权问题

结合理论、法条和实践，算法可能因为运用算法主体的不同、算法针对对象的不同，以及算法所涉及问题的不同而具有不同的性质。可以将算法数据获取行为以行为主体进行划分。公主体的获取和使用即政府有关部门或机关，因公共利益的需要，例如通过联网的监控设备及其内部算法识别并获取行为人的相关信息。而私主体的获取及使用则是一般网络公司、服务商在提供网络服务过程中对用户的收集和使用。

（一）公主体数据获取不违法但应建立必要制约机制

公主体的使用即主要由公安、国安部门以及其他有关政府单位利用有关技术和设备来保障公民权利、维护公共治安。我国社会秩序良好，公安侦破效率逐渐提高，这与公安全国联网的摄像头监控系统密不可分。同时，公安部门的防诈骗系统也在案件数量多、涉案金额大的电信诈骗领域有效运转，该系统能在行为人与受害人的通话、聊天中，使用算法识别语音、文字中的关键词，并及时通过电话、短信等方式提醒受害人，避免损失的发生或扩大。但也正是如此，会让人不免产生自己的人像、位置等信息是否会被摄像头记录，电话、聊天是否会被公安部门监听、监控的担忧。我国的现行制度体系中，政府对公民信息的采集运用的是计算机技术，是由先前编写的算法程序对信息进行独立处理，且政府部门的工作人员无法与公民信息直接接触，政府信息采集的目的也是为了保护公民权利。《中华人民共和国数据安全法》（下文简称数据安全法）第三十五、三十八条也可以看出，我国的立法方向也是允许在一定情况下政府部门有权获取相应数据。

（二）私主体数据获取行为普遍，用户权利救济困难

1.现有法律有待继续完善

私主体的使用也是现阶段主要的公民信息获取主体，相比公主体的使用也更容易出现算法侵权和信息安全问题。《网络安全法》第41—45 条从收集、提供、数据保护等角度对网络运营者以及其他组织责任主体提出了一定的要求。《民法典》第1035—1039 条、以及《刑法》第253 条侵犯公民个人信息罪也有部分规定。2019 年发布实施的《App 违法违规收集使用个人信息行为认定方法》对网络环境下授权协议中的表述形式、告知形式、获取范围等问题作出了更为全面的回应。2021 年发布的《移动互联网应用程序个人信息保护管理暂行规定(征求意见稿)》（下文简称《规定》）第三条和第七条对App 获取用户授权进行了更为有力的规定，要求应用程序不得以用户拒绝授权就强制退出程序的方式逼迫用户进行授权。最新《个人信息保护法》的正式出台为个人信息、数据的保护提供了较为系统的保护制度，以第24 条为代表的“自动化决策”也对网络环境中出现的问题予以回应，这些能够反映出我国司法系统对产业发展进程中诸多热点问题的关注。

2.用户个人举证困难

在现有“谁主张谁举证”的举证责任下，用户需要对网络服务商的侵权行为进行举证。但首先用户对相关计算机技术并不了解，对法律上哪些内容可以作为证据且证明力较强并不知晓。其次，基于算法数据收集、传递的隐秘性，用户无法在被侵权后及时了解自己具体受损的时间和内容，时间的拖延可能会使部分的数据资料因电子信息储存时间的问题而灭失。同时，现阶段对于获取到的数据会直接保存在网络服务商的服务器内部，用户无法直接调取内部有关记录，这也进一步增加了用户调取证据进行举证的难度。

3.赔偿主体范围、责任关系有待进一步确定

算法数据获取的侵权行为现阶段多主张依据产品责任来确定侵权的实际主体。对这种归责模式来说只是将算法的开发者纳入其中，但对于数据的传递、处理、使用过程中其他参与、辅助主体没有纳入到责任承担的范围之内。而实际侵权问题的产生很大程度上就是源自对数据的加工处理和传递使用。因此如何将其他参与者也纳入到责任承担的范围之内，规范相应行为对用户的数据安全和权利保护十分必要。《规定》第十一条、十二条、十三条分别加入了App 第三方服务提供者、移动智能终端生产企业、网络接入服务提供者以及从事App个人信息处理活动相关主体的义务。可以看出我国法律正不断扩大对个人数据的保护。

4.现有规制方法有待进一步加强

传统理论中算法公开是规制算法数据获取的主要行为之一。但在实际应用过程中，算法公开并不能达到有效的规制作用。一方面，即使在算法公开的情况下，算法的开发者也仅仅会公开算法计算机代码本身，而对于代码的含义以及算法运行模式、运算结果等关键内容都不会有详细的解释和说明。在这样的背景下，公开算法的源代码和架构并无太多意义，因为公开并不能提供有效的对算法的说明。代码的公开对一般用户来说并不会产生实际的意义，用户依旧不了解该算法代表着什么。另一方面，为了算法运行的准确性和高效性，越为智能的算法其复杂程度也必然更大，这也大大增加了研究算法本身的难度。

三、构建公主体、私主体、国内、国际全方位个人数据保护机制

（一）扩大政府信息公开范围，细化公开内容

在公主体数据获取不认定为违法的前提下，对公主体信息获取的监督需要从事前事后两方面进行。《数据安全法》第三十五条也明确提出：“有关机关应当按照国家规定和批准手续进行”。但该条只在宏观角度作出原则性规定，并没有具体到应当按照何种规定和手续规范政府行为。

因此在现有法律法规对政府部门的数据获取没有细化规则的情况下，有必要尽快通过部门规章等形式明确公权力主体信息收集的方式、程序、安全保障制度等。例如在获取方式上只能通过公共场所设置的监控摄像头、身份识别系统等获取公民的数据信息；在程序上应当在系统、程序安装运行之前先上报有关上级机构，对应用范围、对象、使用周期、获取内容等关键要素提前进行登记备案，其后应当按照应用领域及时健全数据的储存或删除机制；构建法律约束体系，不仅仅是规制政府行为、保护公民合法权益，也是在配合相关法律在实践当中的具体应用。除此之外，考虑到数据获取的对象是特定的社会公民，应适当将信息获取的数量、用途等关键问题纳入政府信息公开的范围，由政府主动或是依公民申请后公开，建立社会监督体制，保障公民对个人数据去向、用途最基本的知情权。从两方面设置由法律规制和社会制约构成的双保险。最后，公主体收集的个人信息在惩处、调控、监管方面具体应遵循哪些法律适用还需进一步明确，即针对获取数据后，根据数据进行的执法程序也要进一步细化。与信息类型多样相对应的，在法律适用层面也应灵活、变通，不能单纯依靠某一法律条文而对行为人的行为判定违法，例如在举证责任、证据类型、证明标准等方面均需要在现有制度体系上进行一定的调整，或者对数据本身根据现有的证据类型进行一定的转化。

（二）规范上下游关联行为

在前述数据获取算法的整个开发过程中，政府部门一般会委托专业网络科技公司参与前期的研发工作，且系统运行后的运营、管理、维护工作也会需要相关公司的参与。考虑到相关技术具有用途上、功能上的特殊性，有必要对上下游的开发及辅助管理活动进行监管。即便在有知识产权保护制度的情况下，也可能出现网络科技公司对先前技术进行改进，或以此为基础另行开发新系统后自己使用或转卖他人；此类公司在后期运营维管中，也可能存在服务器入侵、数据盗用等问题，这些都会给公民的数据安全造成隐患，且相较直接泄漏数据，技术外泄导致的损害结果可能会更为严重。从《数据安全法》第四十条可以看出，国家在制定法律时也已注意到与政府部门相接触的其他主体可能会出现数据盗用、数据泄漏等安全问题。但该条只片面关注了数据本身。相比直接针对数据本身加工、储存的法律规制，更应当从根本上解决关联方对数据本身处理行为之外的数据获取载体——算法，以及储存介质、管理环节中的安全问题。可以考虑提前与相关主体签订保密协议、算法开源以及程序公开等方法，将数据系统的控制掌握在公权力部门手中。在后期运营管理中也要与其他一般数据相分离。例如设立专用服务器并增加必要的特殊防火墙系统；专业人员进行维护、管理时，应当先经过公权力主体的授权并进行必要的记录。另外，相较于人工直接操作系统，尝试计算机智能管理软件的介入会使得这一过程更加稳健。因为没有对外授予操作权限，整个运行过程可以通过程序代码一目了然，也就避免了人工操作的种种弊端。例如在企业会计领域应用的智能财务软件，就在一定程度上规避了由于员工利益驱动而导致信息泄漏和数据造假的问题。最后，在相关企业内部设立监督岗位，直接派驻政府人员或独立第三人负责相关业务的监管工作也是一个较为可行的方法。但是在这一过程中，一是要明确该岗位所处的管理层级和管理幅度，保证岗位具有监督实权，有条件切实履行岗位职责；二是要注重多方的职能划分和权利制约，杜绝单独受控于管理层或治理层以及岗位内部违纪的情况，强化监管信息每日上报机制，切实保证公主体对个人数据的全方位管控。

（三）行业自律为基础的同时融入监管体制

在外部整体行业层面，现阶段理论中将行业自律作为私主体获取用户数据最主要的规制途径，实践当中以中国互联网协会为核心，以行政区划为单元设立各地的二级网络行业协会以及专项机构等。但以中国互联网协会协会为例，协会中的会员单位，尤其是常务理事、理事单位主要由国有电信公司、大型网络科技公司、知名电子科技企业担任，而这些单位在相关领域一般有较大的市场影响力，较高的行业份额。其公布的行业自律文件可以发现，协会主要的规制领域在不正当竞争、网络信息内容、网络服务等方面。

因此，行业协会内部管理决策机制就有必要重新进行规划和设计。可以采用一企一票的决策方式，保证数量众多的中小型企业能够联合发表意见、影响决策，来维护自身的合法权益；也有利于根据行业内的广泛共识，来排除单纯根据市场份额、行业地位等因素形成大型企业对相关行业标准的掌控。另外，在行业自律的基础上应当合理、适当地融入公权利的监管机制，其功能不在于参与行业的未来发展以及协会的日常行政实务，仅当制定有关管理协定时作为一方主体，对涉及公民权利的普遍性问题有权要求协会尽快制定自律规范，或对现有内容进行一定的审查；也可以在年中、年末可要求协会提供书面报告，对信息获取、传递、使用等关键问题也有权要求协会或主要成员单位进行答复。

（四）联合企业开发设置软硬件内部壁垒

当前个人信息的侵权问题基本来自于私主体，因此如何针对第三方具有隐蔽性、广泛性的过度数据收集行为实施有效的反制手段就显得尤为重要。无论是上层监管还是中层制约，都需要多方的协调和参与，还需要权衡各方的利益诉求和执行成本。这就使得相关措施在执行过程中存在一定的不确定性，实施的效果也受多因素影响。那么，直接从底层的个人入手，强化保护信息来源主体隐私的能力，成为有效且相对易于开展的解决方法。从个人入手的防侵权，重点就要关注个人能够留下包含个人隐私数据的领域和途径。在当今社会，智能手机已经成为了个人的社交中心、信息中心、资源中心，手机内部不但留有用户个人主动保存的数据，也有集中反映用户个性化倾向的数据。基于数据收集过程的种种特点，要求相关企业通过手机硬件或软件的方式，使用户了解各种应用程序的信息收集行为，充分掌握企业获取信息的时间、方式、内容、用途等等，给予用户选择是否允许其行为的权利。当前的海内外市场，相关厂商通过限制登陆、弹窗提醒、沙箱运行等方式已经实现了个人隐私数据的隔离。例如，苹果公司在2020 年六月举行的WWDC 开发者大会上就提出了“应用追踪透明”（App Tracking Transparency，简称ATT），用户可以选择是否允许应用程序追踪或跨平台分享个人数据，并在首次使用该应用程序时以弹窗的方式提醒用户。且该功能属于一个全新的框架，需要应用程序开发者与之匹配，开发者只有获得用户授权后才能获取用户的搜索习惯、经常关注点等内容。该功能的推送是用户数据保护的良好开端，势必会推动互联网信息获取的变革。但现在还属于个例，其他电子信息产业软件、硬件开发公司可以以此为例，适当情况下也可以由政府有关部门通过行政指导的方式，联合企业共同构建数据保护壁垒。

（五）以司法解释为主要方法，细化侵权认定标准、举证责任、证明标准等关键问题

基于算法信息获取的方式隐秘性、时间不定性等特点，让用户无法在信息获取过程中或信息获取完成后的适当时间内发现并举证。无论是从时间还是技术角度，用户都很难进行处理，即使现有法条对损害赔偿请求权的诉讼时效是从“知道或应当知道”时起算，但很有可能在用户知晓时，因为时间过长，相关数据已经过了服务器的存储时间，无论是用户还是服务商都无法再对先前的信息获取行为进行举证。这就需要结合电子信息产业的特点作出针对性的调整，应当从两方面作出细化规定。一方面，基于电子信息存储的特点，结合数据储存时间问题，对侵权行为“知道或应当知道”的一般诉讼时效起算点依旧不变，而将电子信息的一般储存时间作为从侵权行为开始时起算的最长诉讼时效。当然，如果侵权行为是持续存在的，如一旦使用就会获取信息，那时效的计算将随侵权行为的存在而重新计算。考虑到电子信息行业的更新迭代快、时间成本高的特点，最长诉讼时效的存在也没有给网络公司创造违法的可乘之机，网络公司不会冒数据无用的风险，将数据拖延到最长保护期后再进行使用。而双重时效的设置能够在因时间造成的举证不能情况中缓解法院的受案压力，节约司法资源。另一方面，明确举证证明责任问题应当考虑到网络公司在其中的专业性、主导性的优势地位，在网络公司对算法的开发与使用、数据的获取与传递、数据储存载体的控制与管理等内容均明确知晓的情况下，应将较多部分证明责任由网络公司来承担，如获取途径、获取内容、信息用途、免责事由等。只要求用户对基本内容承担举证责任，如不知晓授权或被迫授权、具体损失等。

（六）以事前设置个人数据传递门槛、事后司法协助双角度谨防区际、国际数据侵权

网络信息传递的快速性、无形性致使数据在境内外流转，境外直接对国内进行的国际数据侵权变得更加难以被发觉。应当从事前事后、国内国际多角度去解决国际数据侵权问题。不同于政府数据，于境外针对个人数据实施的侵权行为不构成对国家主权的侵犯，其受害主体一般只是用户。相较于政府数据的境内外传递需要审批、备案等程序，对个人数据国际保护的关键在于知情、同意、权利救济等内容。2018 年美国通过《开放政府数据法案》，大力平衡数据跨境流动与安全因素。同年，欧盟通过《非个人数据在欧盟境内自由流动框架条例》，消除各成员国数据本地化要求，保障专业机构自由迁移数据，保障数据可携带权充分的灵活自由度。同时，中国香港地区也在积极运用《跨境资料转移条例》《跨境资料转移指引》，通过“合规—问责—伦理道德监督”的机制，保障个人数据跨境流通的安全。

考虑到授权的现状，即使网络公司为了获得反馈数据优化产品，但区际、国际之间的信息传递已经超过了正常优化产品的需求，且国际之间的信息交换造成的不利结果更加不可控制，救济也更加困难。因此，应当在基础授权之外单独另设授权条款，用更为醒目的方式进行标注，且拒绝授权该条款不得影响功能的正常使用，将区际、国际数据交换单独进行规制。权利救济方面首先应当从管辖入手，协议管辖条款应取消现有网络服务协议格式条款中由公司住所地法院管辖，转而倾向用户，由用户户籍地或经常居所地法院管辖。跨境数据传递门槛可由行业协会制定规章的方式进行规定，不以法律条文的形式体现。

完善相应司法协助体系，在侵权行为实际发生后，当事人提起诉讼并可向法院申请，法院依据双边、多边司法协助条款对事实认定、证据取得、财产保全、文书送达等内容通过有关程序，在该国有关部门的帮助下进行。若特殊情况下如果受害群体多、受害结果重大，影响到互联网行业有序发展的则可由政府有关部门以破坏网络秩序、或侵害公民信息罪等提起诉讼并通过行政渠道进行司法协助。除专门涉及互联网行业的双边或多边条约外，司法协助条款不必以重新订立双边、多边条约的方式进行，先前订立的条约中若已包含有关司法协助的内容，则可以直接参照适用。

四、结语

算法是科技进步的产物，当今社会，算法结合大数据、人工智能等尖端技术和高性能的计算机硬件，其智能化正不断凸显，且在多领域被广泛应用。尤其在网络行业中服务推送的针对性、公共治安领域中案情处理的及时性都得益于智能算法在数据收集、分析、整合中的广泛应用。也正是如此，如何规范算法对个人数据的获取、处理和传递是如今网络化时代下关乎个人数据安全的重点问题。近年来我国《个人信息保护法》《数据安全法》等相关法律文件的公布可以看出我国提升对个人数据的保护的重视程度，但相比于欧美发达国家多年的立法、实践经验，我国在个人数据保护上还存有短板。基于我国社会发展的具体情况和实践应用中存在的问题，在行政角度应当对公权力主体的数据收集增设监督程序；对一般网络服务商应以行业自律为主的同时结合政府有关机关的指导和监管；在司法角度应继续明确举证责任、证明标准等关键问题，确保公民能以诉讼作为最后的维权途径；国内联合企业设置软硬件安全壁垒，国际联合有关部门互助协作等多个角度规范算法数据收集行为，切实保障公民数据安全。