胡峻峰
用户画像机制下信息定向推送的权利保护与法律规制
胡峻峰
(华东政法大学,法律学院,上海 200042)
信息时代的到来,便利了人与人之间的社会交往和商业合作。尤其是随着大数据技术的发展,互联网平台可以通过数据的收集和分析对用户进行分析建模,定向推送用户所偏好以及需求的信息。这种便利的实现得益于用户画像机制的广泛应用。用户画像机制不仅有基础性服务推送,还有增值性服务推送。然而这种基于自动画像机制下信息的定向推送,在便利生活工作的同时,也存在着侵犯个人信息权利的法律风险。法律作为调整社会行为的社会规范,需要对这些法律风险予以回应,可以通过用户允许前置、去标签化、数据脱敏、被遗忘权确立等方式来规制不合法的信息推送,更好地保障用户权利和互联网秩序。
用户画像;信息推送;数据保护;法律规制
大数据时代,消费者在网上的浏览、点击、留言、评论等碎片化的行为轨迹被整理搜集并存储起来,这些行为轨迹直接或间接反映了消费者的性格、习惯、态度等信息,能被用来为企业实施营销提供决策依据。而这些碎片化的、整理存储在数据库中的数据,能被企业用来完整地重构消费者的需求。这些从全方位、立体性的记录消费者的数据,被称之为“用户画像 ”[1]。而渴望增加用户黏性的企业就充分运用用户画像这一大数据机制,为用户推送了大量的个性化信息。例如,当我们打开知乎首页的“推荐”功能页,会发现“推荐”功能页所推荐的话题很多都是我们所感兴趣或者目前最关注的领域;当我们在手机上打开新浪微博首页的“热门推送”,可以发现“热门推送”的内容在大多数情况下是我们喜欢的内容;当我们打开百度、搜狗等搜索引擎搜索需要寻找的内容时,搜索引擎推送的内容总是自己最近搜索过或者是在其他平台浏览过的相关信息。
不可否认的是,基于用户自动画像机制下的信息定向推送,在大多数情况下节约了我们初始信息检索和收集的时间,给我们的生活和工作带来了极大便利,也降低了市场交易的成本。但是,在享受科技便利的同时,我们也不得不承认科技是一把双刃剑。大数据和人工智能系统对我们进行“画像”,形成一个“感官的印象”。我们自身可能无法知道我们被这些软件或系统进行了画像,更无从知晓这些画像是否真实。换言之,网络系统基于其对于个人信息的手机,从而给我们设定一些标签。而我们可能不知道它给我们设定了何种标签,这些标签的正确与否,以及这些标签转移到其他场合之际,是否会对我们的权利产生不利的影响,比如可能影响我们申请贷款、找工作等。
强调个性化的定向推送建立在用户画像机制之上。因此,为准确地、更好地保信息接受者的权利,首先要析清信息定向推送的基础机制。
用户画像机制的运作首先并非商业性的,作为一项计算机运行机制乃是一项技术。技术具有工具性价值,而工具性价值地实现得益于该项技术或工具具备某项功能。用户画像机制也不例外,作为一项技术,其得以广泛使用在于其功能。《大数据时代》的作者维克托·迈-舍恩伯格认为,大数据的简单算法比小数据的复杂算法更有效,大数据让人们不再期待精准性,而是混杂性[2]。怎样从混杂性的大数据中挖掘有价值的相关信息,成为企业必须思考的问题。因此,由这些数据组成的“用户画像”,不仅再现了用户的全貌,反映了用户的需求,而且是企业挖掘用户需求与价值、进行用户细分、实施精准营销及其他活动的基础。
然而,用户画像所带来的最大问题,是在用户完全不知情的状态下对用户进行跟踪和记录,并可能引入第三方的介入[3]。这可能侵犯了接受者的隐私权或个人信息权。再者,提供商收集已有数据,通过已有数据推断我们是怎样的一个潜在消费者。并且,行为轨迹数据推断出来的未来行为的确具有很强的预测性,但数据记录本身无法识别浏览轨迹的主观内容。而且,过去数据所描绘出的用户画像是过去的,不代表将来的。今天我们在百度搜索了有关感冒相关的信息,百度给我们推送了许多关于干预感冒相关的信息,迎合了我们的需求,但是当我们的感冒好了之后,其再次推送相关的信息,就对我们造成不必要了的信息干扰。用户画像机制下所描绘出的我们是否是真实的我们以及如果这种错误画像是否会给他人造成错误性的引导?这都是定向推送机制下我们需要解决的问题,但解决这些问题最基础的步骤就是要明确用户画像机制、相关主体的权利义务,进而提出相应的保护或应对方案,才能更好地保护用户。
用户画像机制借助现代的大数据挖掘与分析,还可以通过大量的数据分布特点分析用户的偏好、需求。通过跨平台、跨领域的广泛数据收集,在服务器后台可以针对每个用户建立一个数据模型,该模型可以分析出用户的性格喜好、个人特性以及过去现在和将来所处的生活阶段,而这种分析对于信息定向的服务推送具有重大意义。对于大多数用户来说,在信息爆炸的时代,大量的数据检索和筛选是需要付出巨大的时间成本。大数据基础上定向推送替代人工去筛选就能达到降低了用户时间成本的目的。以一位准妈妈为例,在孩子出生之前,孩子的母亲会在网络上查询搜集有关于抚养婴儿的各种资讯,用户画像在收集到这些数据之后,会在后台建立出准妈妈这一数据画像。当该用户再次使用互联网产品时,相关的资讯便会推送出来,与此同时,随着婴儿的出生、成长,不同阶段所需要的信息也不同,而用户画像机制则会根据孩子所处的不同阶段推送符合需求的不同信息。这一定向推送机制就减少了用户收集特定信息的不必要麻烦,提高了获取信息的效率。并且,这种服务并不限于浏览器之中,如微信、知乎等移动APP也可以应用用户画像机制,推送我们所需要的信息。如在知乎社区“推荐”中,一名爱好写作的人可以收到知乎写作大V的最新作品和写作经验分享。因此,对于用户来说,这是一种极为便利的服务功能性推送,对于提高用户体验、产品服务与运作效率都十分有益。
除前述服务功能性推送外,用户画像机制还应用于商业盈利性推送。正是这种商业盈利性推送让用户画像机制备受诟病,似乎这是用户画像机制的原罪。“通过用户画像记录用户在该网站的点击行为和浏览历史,通过后台收到的用户画像并对其分析,向用户提供精准推荐服务,把用户可能感兴趣的信息推荐给用户,在提高用户体验的同时,也给网站带来更多的利益”[4]。营利性为首要目的的商业主体为用户提供了基础性的商业服务,其最终目的是为了获取用户,实现盈利。基于用户画像机制所进行的定向信息推送正是出于盈利的目的应运而生,并被广泛运用于各个商业领域。
基于用户画像机制的增值性信息推送可以分为两大类:一类是互联网平台自身的商品信息推送;另一类是搜索引擎的互联网广告的精准投放和推送。第一类以淘宝网和亚马逊网站为典型代表。比如淘宝网统计买家购买偏好以便进行CCM(定向广告投放),所以现在每个人看到手机或其他移动终端上的淘宝APP界面都是不同的[5]。从2015年开始,淘宝在移动终端全面铺开个性化推送业务。淘宝网实现设置了数百个不同的推送参数和用户标签,通过整合用户的浏览痕迹和日常购物记录,运用大数据的技术,勾勒出每个用户特定的画像,判断和预测该用户最近一段时间可能购买的产品或服务,从而有针对性地推送相关信息,以增加用户购买次数和数量。无独有偶,亚马逊网站也采取类似的定向信息推送。不同用户登录亚马逊网站看到的首页推荐商品展示内容都不同,同一用户在不同时间段登录亚马逊首页看到的商品内容也在不断发生着变化。在商品的详情页下会出现组合购买的推荐提示,同时还会出现一行类似商品推荐给用户。此外,亚马逊网站还根据消费者曾经的浏览历史和订单记录不定期地向用户发送广告邮件进行营销,推送可能符合用户消费需求的相关商家活动、商品价格等信息,据统计,其推荐的销售转化率可高达60%[6]。第二类是以百度搜索为代表的搜索引擎广告的精准投放和推送,主要是在跟踪用户并分析用户行为的基础上进行信息转售。对于该种推送第一步要做的仍是收集用户浏览轨迹信息,然后通过挖掘分析信息形成轨迹规律,导出特定的用户画像记录,并保存到本地的用户画像文件夹中。不同的是,该软件并不直接运用软件的用户画像信息记录促进本软件所属商业主体的产品推广,因为软件本身不从事产品与服务的销售。但软件所属的商业主体需要谋利,谋利方式就是推送广告。为实现精准,就要借助用户画像机制对每个用户进行画像建模,预测用户的偏好和需求。为实现营销或推送则需要借助其他机制。这种机制就是软件设置广告位或广告发布系统,需要发布广告的商家将自己的产品发给网络应用所属商家。网络应用所属商家提炼产品中的关键词,当关键词通过算法匹配到用户画像文件夹中的浏览轨迹规律,用户再次使用互联网产品时,产品就会被推送给用户。以上文所提到准妈妈为例,根据准妈妈的浏览轨迹和信息偏好,用户画像机制会在后台建立出准妈妈这一数据画像模型。根据这一数据模型,系统会推测出该用户所需要的商品,如婴儿纸尿裤和婴儿奶粉等。需要发布广告的商家以及购物平台便依据这一用户画像机制下的预测,将相关产品的广告推送给用户,与此同时,随着婴儿的出生、成长,而用户画像机制则会根据孩子所处的不同阶段推送不同商品的广告,以实现信息推送利益的最大化。
在基于用户自动画像所进行的定向信息推送的过程中,主要利用的是用户个人在网络平台上所留下的使用痕迹——即用户浏览数据。明确定向信息推送的过程中用户的个人权利,首先要对用户浏览数据的权利属性做一基本界定。
一方面,用户在网络平台所留下的使用痕迹,涉及到个人的兴趣爱好、消费能力、经济水平等一系列较为私密的个人信息,这些信息具有强烈的符号属性和象征意义,基于使用痕迹给用户描绘出的用户画像会给用户自身带来不同的社会评价。在现实生活中,该类信息对于塑造用户人格具有重要的意义和价值,因此其具有人格权的属性。另一方面,用户浏览数据作为个人信息的一种,在大数据时代的商业活动中发挥着重要作用和价值。通过分析这类数据信息,描绘出不同用户的不同特征,从而判断和预测该用户的不同商业需求。在互联网平台自身的商品推荐中,通过用户画像机制所推送的信息,可以提高用户黏性,增加用户的活跃度,扩大平台的影响力;同时减少了用户搜索商品的时间和难度,极大地提高了用户对于商品的初次购买程度和回购率,促进了商品成交量。在网络搜索引擎的信息推送中,运用自动画像这一数据分析整合手段,可以更准确地推送用户所需要寻找的资讯,增加了潜在交易机会。在这样的模式下,用户对于推送信息的点击量和浏览量会大幅度提升,同时交易转化率也相应增加,给搜索引擎所有者带来巨额的广告收入。因此,用户浏览数据这一特定个人信息具有明显的财产属性。综上,笔者认为,在信息定向推送过程中所使用的用户浏览数据兼具人格权和财产权复合权利性质。
在定义完个人数据的权利性质之后,将目光投射到互联网平台基于自动画像机制进行信息定向推送的过程中,便会发现存在诸多涉嫌侵犯个人权利之处。
首先,在收集信息之前的说明义务存在瑕疵。当用户与互联网平台接触之际,互联网平台往往会向用户出示一份用户须知或者隐私保护声明,但是这些须知或者声明往往比较隐蔽,容易被用户忽略。例如百度搜索引擎的用户须知是在其主页最下方的位置,并且是浅色的较小字体标注,一般情况下很难发现其存在;新浪微博和腾讯的微信亦是如此,其同样以较小的字体描述这些须知和声明。这种行为涉嫌侵犯用户知情权。知情权是个人对公共事务及与自己有关或感兴趣的事务接近和了解的权利,包括知政权、社会知情权和个人信息知情权[7]。当用户在接触这些互联网平台时,对于平台提供的互联网服务本身,以及在使用这些服务的过程中涉及的个人信息相关的所有事务,拥有接近和了解的权利。互联网平台出于自身利益考量,将用户须知或者隐私保护声明弱化处理,试图谈出用户视野,这阻碍了用户了解权利范围的信息,涉嫌侵犯其知情权。
其次,这些须知和声明本身的有效性存在争议。该类文件是以格式合同的形式向用户出示,并且在合同中以免责条款的形式豁免其可能对用户个人信息以及其他权利造成损害的法律责任。而问题在于,合同文件的描述并不准确,很多关于个人信息方面的描述运用大量专业属于以及概括性语言,没有相关知识背景的一般用户是无法理解其具体含义以及可能造成的后果,同时,用户的这类同意是概括同意,不能就个别条款与互联网平台进行磋商,互联网平台很容易利用自身的强势地位,设置关于个人信息方面的格式免责条款,使用户丧失选择的空间。《合同法》第四十条规定:“格式条款具有本法第五十二条和第五十三条规定情形的,或者提供格式条款一方免除其责任、加重对方责任、排除对方主要权利的,该条款无效”。互联网平台此类的免责声明中部分条款存在免除自身责任、加重用户责任、排除用户主要权利的情形,用户的自主选择权和知情权受到不同程度的损害,因此该类文件的法律效力存在争议,能否受到法律的肯定性评价存疑。
最后,将用户信息进行贩卖以及标签化处理涉嫌侵害个人隐私。个人隐私又称私人生活秘密或私生活秘密,是指私人生活安宁不受他人非法干扰,私人信息保密不受他人非法搜集、刺探和公开。隐私包括私生活安宁和私生活秘密两个方面[8]。目前学界的主流观点认为,互联网平台对于用户信息单纯的收集不会侵犯个人生活安宁,也不会窥探私人信息,因此不构成侵犯隐私权的行为。但是,当互联网平台将收集之后的个人信息进行商业化处理,则会触碰到隐私权的权利边界。
一般情况下,互联网平台在收集完个人信息之后进行大数据分析并且运用于自身的服务推广,这样的模式下用户数据未发生转移,是处于同意控制主体手中。但是当将数据作为一种商品进行交易,必然会发生数据的转移,而转移过程中数据存在泄露的风险。互联网平台对于收集到的个人信息具有妥善保管的义务,需要确保数据处于安全、不为外界所知的状态下。而在数据转移的过程中,由于硬件故障或不法分子使用技术手段对数据进行拦截或者拷贝的情况,个人信息泄露的风险急剧增加,个人隐私权处于危险的状态之中。同时,用户对于最终数据的使用过程和使用目的也是不可控的。当互联网平台将收集的信息进行贩卖之后,出于商业利润最大化的考量,信息购买者往往会无限制地利用个人信息,通过原有信息推测出用户需求进行电话和网络,甚至根据个人地址信息进行上门推销,这种信息贩卖行为曝光了用户的个人诸多私密信息,涉嫌个人侵犯隐私权利。
此外,在自动画像的机制中,数据分析者需要对用户数据进行标签化处理,以此有针对地推送信息。而这种标签化容易被外界得知,甚至某些软件的标签是公开对外的①。这种基于个人特性的标签化行为带有强烈的价值判断,将用户分为不同的类别。在现实中,虽然这种分类是某些用户所特意追求,以借此标榜个人特性,但也存在大量用户排斥和拒绝这种分类。其原因在于通过标签,外界会推测出诸多个人私密的信息。例如“社交达人”的标签,外界会推测出该用户在社交媒体上活跃度较高,喜好通过某些社交软件交友。这样就把某些用户不想为外界得知的信息在未经用户许可的情况下对外传播,甚至是将某些错误的信息对外传播,对用户个人隐私权利甚至名誉权、健康权造成损害,给用户带来巨大的困扰和不便。
《全国人大常委会关于加强网络信息保护的决定》第2条规定:“网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式”。该条规定要求网络服务提供者在收集用户个人信息时所需要遵循的两条规则。其一是遵循合法、正当、必要的原则,其二是必须明示收集和使用信息的目的以及方式。这两条规则体现在具体的规制手段上即是对于个人信息的收集应当做到用户允许前置。用户允许前置是指网络服务者在收集用户信息之前应当获得用户的授权,只有在充分的授权之后,才可以对个人信息进行收集和处理利用。具体而言,分为以下两种具体的机制:
1.传统的“知情-同意”机制。这一机制需要网络服务者让用户知晓信息收集的存在,并且得到用户的同意后方可进行收集。这一机制在互联网空间个人信息领域属于传统的保护机制,但是仍然存在着不容忽视的现实价值。这一传统机制的主要目的是为了防止互联网平台借助单方的优势地位和技术手段掩盖其肆意收集用户个人数据的行为。值得注意的是,“知情”不是做到默认知情,而是需要分割同意协议书中的用户画像机制信息收集条款,做出弹窗式设置。字体与字号都必须采用具有鲜明特点的方式显示。如果用户不想被收集信息或同意收集部分信息,需要设置“Do Not Track”按键,允许用户选择软件不得追踪。在第三方广告主体不愿意单独接触单个用户且无力同用户群合法接触的情况下,由服务提供者同用户进行接触仍然是必要的。但服务提供者不得将浏览轨迹信息转让条款嵌入整体同意协议中,关于第三方广告投放的同意也需要坚持“知情-同意”,并且明确强制弹出性窗口的明示同意获得。
对于用户画像机制来说,“知情-同意”规则似乎显得更为特殊。其原因在于该规则是针对单纯收集信息而言,但用户画像涉及到个人信息收集之后的再处理。对于用户画像技术的法律规制,欧盟走在世界的前列。根据2018年5月25日正式生效的欧盟《通用数据保护条例》(General Data Protection Regulation,简称GDPR)第13、21和22条的相关规定,在用户的画像活动中, 如果需要获得用户合法有效的同意, 首先应当向数据主体全面介绍数据的处理活动是如何进行的, 评估结果是否会对用户产生法律上的影响;其次, 应当明确告知用户其享有对画像的反对权。此类信息应当明确无误地表达, 并使用足够引起用户注意的范式。此外, 基于个人敏感数据的画像活动是被禁止的, 除非数据主体出于一个或者多个特定的目的, 被给予了明确的同意;或者该画像活动对于重大的公共利益是必需的。从CDPR的规定可以看出,鉴于用户画像对于个人权利的危害,主管部门对其设定了更为严苛的法律规则。
将视野从欧洲大陆转回到中国,我们可以借鉴这种先进的立法观念来设计与本土实情相适应的“知情-同意”的规则来规制用户画像机制的滥用。首先,除上文提及的明示知情同意外,信息收集者应当为用户画像机制增加额外的风险提示。在告知用户需要对其个人信息收集的基础上,需要进一步说明用户画像的含义和这种机制运作的技术原理及其过程,同时也应当一并告知用户画像机制下可能出现的风险状况,对于个人隐私侵害的风险应当清晰表述,不能使用模糊和概括的文字表述。其次,信息收集者应该给与用户一定的自主选择权。个人信息具有巨大的经济价值,让互联网平台更容易地推送用户感兴趣的信息,增强了用户黏性,扩大平台影响力。因此在进行制度设计时,应当平衡个人隐私和合理利用之间的利益诉求。在用户画像机制中,信息收集者应当将对个人信息的自行合理使用与二次贩卖利用分离开来,赋予用户拒绝将其信息二次贩卖利用的自主选择权,在用户明确表示反对的情况下,将其个人信息的使用局限在已经同意的范围内,从而实现个人信息经济价值和个人权利保护的均衡。最后,对于个人敏感数据的画像活动,例如涉及健康信息、性生活和性取向、身份证件号码、金融信息、政治意见、通讯信息、基因信息、生物特征信息和精确地理位置的画像描绘和信息推送[9],应当通过立法的方式予以明确禁止。只有通过“知情-同意”机制,在用户明示同意或者处于公共利益考量的例外情况下,此类基于用户敏感数据的画像行为才可以被允许。
2.新兴的具体场景风险评估机制。2015年,美国颁布《消费者隐私权利法案(草案)》(Consumer Privacy Bill of Rights Act of 2015,简称CPBR),引入了以场景为主导的个人信息保护新机制,开启了个人信息保护的新篇章。个人信息处理是否合理,取决于引发的影响能否为用户所接受,或是否符合用户的“合理预期”。影响用户接受程度或对个人信息利用的敏感程度的因素即统称为“信息场景”或“场景”[10]。这一机制与上文所论述的“知情-同意”机制最大的进步在于,其以隐私风险作为衡量个人信息“合理使用”的指标,根据具体场景中的风险评估采取差异化保障措施,变信息处理前的静态合规遵循为信息使用中的动态风险控制,在提升个人信息保护实效性的同时大幅减轻互联网平台的负担,达到个人信息保护和商业发展的有效平衡。
该规则的运用可以分为两部分,第一部分是建立合理的隐私风险评估标准。这一风险评估的基准在于个人信息可能引发的隐私风险,即所造成的隐私风险是否符合用户的合理隐私期待,或是否对用户造成不合理的负面影响。同时通过一系列技术手段将不同的个人信息按照其敏感程度,赋予不同的权重,通过加权的方式将最终的隐私风险指标化,已达到指导具体场景差异保障的目的。第二部分是根据评估结果,划分个人信息处理的风险等级并采取不同的信息保护措施。例如采取欧盟GDPR中的路径,将风险程度划分为高、中、低三级,而具体划分和控制风险的方式,互联网平台可以在政府相关部门(如工信部)的指导下,结合自身状况和互联网实际运作情形在具体实践中加以明确。
与“知情-同意”机制相比,虽然具体场景风险评估机制更为先进和科学,但是在当下中国互联网环境中,诸多与其相配套的机制和技术手段有所欠缺,因此应当以经典的“知情-同意”机制为主要的法律规制手段,具体场景风险评估机制作为辅助规制手段,以保护用户的个人信息安全。
个人信息数据的收集方通过必要的“用户须知”、“服务协议”等格式条款获得用户的授权之后,需要承担妥善保管以及对数据进行合理利用的义务。而对于涉及个人隐私或用户不愿让他人知晓的数据信息,数据收集方有采取技术手段对数据进行特殊处理的义务。现阶段的技术条件下,数据收集方所需要采取的方式为数据脱敏和去标签化。
数据脱敏又称数据去隐私化或数据变形,是在给定的规则、策略下对敏感数据进行变换、修改的技术机制,能够在很大程度上解决敏感数据在非可信环境中使用的问题[11]。根据数据脱敏的效果,可以将其分为两大类:可恢复类和不可恢复类。可恢复类指经过脱敏处理的数据可以通过一定的方式恢复成原始数据,以各种加解密算法为代表;不可恢复类则是指经过脱敏处理的数据无法复原,如模糊、掩盖[12]。从数据的功能上看,不可恢复类脱敏主要用于数据的共享与公开,而可恢复类则同时可用于静态存储和动态传输时数据安全隐私的防护。从数据的权利属性看,数据的权利是最终归属于用户本人的,当敏感数据在一种不可信的公开环境中公开与共享中,数据收集方需要对用户的敏感数据采用不可恢复性的数据脱敏这一保护方式,以避免发生非法的数据利用者利用技术手段将其恢复,从而侵犯数据提供者的权利;当敏感数据是出于静态存储和动态传输时,数据收集方需要对用户的敏感数据采用可恢复性的数据脱敏这一保护方式,当数据提供者需要重新找回自身数据时,数据收集方可以将敏感数据予以恢复,以实现数据主权者的查询。
用户画像机制的一大特点是在对用户个人的大数据收集的基础上,对用户进行画像建模,以预测用户的某些需求。这种预测是建立在贴标签的基础之上。一个用户的数据模型是由无数个标签所组成的。标签是人机快速交互的枢纽,一方面通过简洁的词汇向人传递其背后的信息;另一方面通过负责后端的数据处理得出相关标签。比如购物平台会对用户贴上“数码爱好者”、“NIKE忠实粉”、“篮球迷”等标签。在大多数情况下,正确的标签可以准确预测用户的某些需求,达到用户时间成本的节约和广告准确推送的双赢局面。但是也存在不容忽视的情况,即这种标签存在着错误的可能。基于错误的标签而推送的信息,不仅会加大用户搜集信息的时间成本,而且在特定的情况下,会造成用户个人名誉和安全方面的危险②。
在用户画像机制的标签化中,数据的使用者单方面给用户设置一系列标签,即使这些标签能够准确地反映用户的形象,也在一定程度上侵犯了个人的数据知情权和处理权。对于涉及个人隐私领域内的敏感标签,当数据使用者将这些敏感标签放置于网络环境这一公共领域中,更侵犯了用户的隐私权。基于此,数据收集方有义务分析敏感标签给用户带来的风险,并且通过去标签化的技术手段保护用户的个人信息。
用户画像机制的运行基础是用户在互联网世界所留下的个人信息,正是基于广泛的个人数据,数据的收集者才得以建立起用户的数据画像模型,那么,作为数据提供者的个人是否有权利要求数据收集者删除或者改变这一数据画像模型?被遗忘权的权利确立为用户个人信息的保护开辟了一条可能的保护路径。
2012年初,欧盟提出了一项新的权利——被遗忘权[13],意图赋予人们删除那些不充分、不相关或过时不再相关的数字信息的权利,帮助人们摆脱尴尬的过去。2014年年5月13日,“谷歌西班牙公司案”尘埃落定[13],被遗忘权正式接受欧盟司法实践检验,欧盟法院最终裁定,谷歌西班牙公司败诉,必须移除相关搜索链接。随后,谷歌方面执行了判决,并出台了在线申请程序,正式接受欧盟用户的被遗忘权申请。在被遗忘权的权利构成中,数据控制者的义务如下:当权利主体行使被遗忘权时,数据控制者应该采取一切合理措施去删除数据。如果数据没有正当理由被公开或传送给第三方,原始数据控制者还应通知第三方,确保数据被删除。控制者应该告知权利主体,相关第三方可能采取的措施[13]。“被遗忘权”已经被认为是一项法定权利,而且是一种值得受到法定保护的价值或利益。这一权利被归类为一种隐私主张,即使它被应用于至少在某种程度上公开的信息。它代表着“信息的自我决定”和以控制为基础的隐私定义,并且试图将个人信息从公共领域转移到私人领域。这一权利暗示着个人对自己个人信息的控制权,个人决定这些信息将会怎样,并且即使“离开其掌控”,也保持着对它的控制[14]。
在用户画像机制的运行过程中,用户浏览数据的收集是画像建模和信息定向推送的基础。当数据经过特殊的加工和分析之后,其最初的权利归属于用户个人。当这种数据的运用不符合数据提供者的意愿,甚至给其个人权利带来潜在或现实的威胁时,数据提供者可以要求数据的控制者和使用者将其进行技术化处理。因此当被遗忘权被应用到用户画像的机制中,作为数据提供者的个人便有权要求数据收集者删除或者改变数据画像模型,以达到保护个人信息的目的。
互联网技术的迅猛发展会“废除所有能够带来稳定和秩序的传统故事和符号,而重新讲述一个关于技能、技术知识和消费美梦的故事”[15]。现阶段的个人信息权面临着互联网广泛化、大数据滥觞等不同因素的冲击,个人权利与技术进步、生活便利的张力更为明显。其中,在经济效益与快消商业文化需求下,精准消费与营销更为人们所需求和欢迎,用户画像机制应运而生。但是,这种信息收集在很大程度上并未取得用户的同意,侵犯用户的信息权等其他合法权利,甚至对用户的生活和工作产生一定困恼。因此,采取相应方案就是必要的以及充分的。这些方案包括不同阶段与不同内容的“知情-同意”、具体场景风险评估机制、数据脱敏和去标签化以及被遗忘权的保护路径,以用来更好地保障用户的权益。
① 如滴滴顺风车和微博的个人主页,可以看到对于用户个人的描述性标签。
② 比如在滴滴顺风车的评论中,将乘客的形象通过关键词的方式予以展示,给用户尤其是女性用户的形象和安全带来潜在的危险。
[1] 谢然.从五大行业案例看大数据的应用逻辑[J].互联网周刊,2015(2):30.
[2] 维克托·迈尔-恩伯格,肯尼斯·库克耶.大数据时代: 生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:7-30.
[3] 石佳友.网络环境下的个人信息保护立法[J].苏州大学学报(哲学社会科学版),2012(6):89.
[4] 方霞.用户画像安全与用户隐私研究[J].科技通报,2013(8):37.
[5] 周林彬,马恩斯.大数据确权的法律经济学分析[J].东北师大学报(哲学社会科学版),2018(2):30.
[6] 农琴倩,鲍旖睛.大数据时代下广告精准投放的实现策略[J].传播与版权,2016(8):54.
[7] 张新宝.隐私权的法律保护[M].北京:群众出版社,2004:85-87.
[8] 王利明.隐私权概念的再界定[J].法学家,2012(1):108-122.
[9] 胡文涛.我国个人敏感信息界定之构想[J].中国法学,2018(5):235.
[10] 范为.大数据时代个人信息保护的路径重构[J].环球法律评论,2016(5):97.
[11] 陈天莹,陈剑锋.大数据环境下的智能数据脱敏系统[J].通信技术,2016(7):58.
[12] 卞超轶,朱少敏,周涛.一种基于保形加密的大数据脱敏系统实现及评估[J].运营技术广角,2017(5):120.
[13] 郑志峰.网络社会的被遗忘权研究[J].法商研究,2015(6):50.
[14] 吴飞,傅正科.大数据与被遗忘权[J].浙江大学学报(人文社会科学版),2015(3):73.
[15] NEIL POSTMAN.技术垄断:文明向技术投降[M].蔡金栋,译.北京:机械工业出版社,2013:21.
Rights Protection and Legal Regulation of Information Directional Push under User Portrait Mechanism
HU JUNFENG
(East China University of Political Science and Law, College of Law, Shanghai)
the advent of the information age facilitates social exchanges and business cooperation between people. In particular, with the development of big data technology, Internet platforms can analyze and model users through data collection and analysis, and deliver information of users' preferences and demands. This convenient implementation benefits from the widespread use of user portrait mechanisms. The user portrait mechanism has not only service functional push, but also commercial profitability push. However, based on automatic portrait mechanism, the targeted push of information not only facilitates life and work, but also has the legal risk of violating personal information rights. As a social norm to adjust social behavior, law needs to respond to these legal risks. It can regulate the illegal information push through users' permission to front, de-label, data desensitization, and the establishment of the right to be forgotten, so as to better protect users' rights and the order of the Internet.
User Portrait; Information Push; Data Protection; Legal Regulation
D923.7
A
1008-472X(2018)04-0036-08
2018-10-17
胡峻峰(1994-),男,安徽宣城人,华东政法大学法学研究生,研究方向:法理学。
本文推荐专家:
韩松,西北政法大学,教授,研究方向:民商经济法。
焦和平,西北政法大学,副教授,研究方向:民法和知识产权法。