算法背景下个人征信信息的法律保护: 现实表征与破解路径

2022-03-11 23:57李牧翰黎四奇
江汉论坛 2022年3期
关键词:算法

李牧翰 黎四奇

摘要:征信业作为金融领域重要的功能性行业,涉及到金融机构与个人征信信息等多方面因素,具有十分重要的价值。征信业在算法与数据环境下体现出新的数据化与网络化特征,但这些特征也引发了个人征信信息领域新的隐患与风险,具体表现为信用歧视、信用错误评价、信用信息泄露、自决与透明原则的破坏等方面,影响了征信领域乃至整体金融领域的稳定性。应当基于法律规制与保护的正当性理论,从法治与技术两个方面对上述风险进行防控,具体包括实现立法的高位阶化与概念标准统一化、引入区块链分布式类型化数据储存模式的运用、专门行业协会的构建等,以此实现我国征信业数据及算法背景下个人征信信息的有效保护与协同治理。

关键词:征信业;算法;个人征信信息;征信信息保护

基金项目:湖南省研究生科研创新项目“金融算法侵权风险及其治理——基于金融消费者权益保护视角”(OL20210105)

中图分类号:D922.16    文獻标识码:A    文章编号:1003-854X(2022)03-0104-04

一、个人征信信息保护的研究趋势

征信是征信机构将个人信息采集分析并提供给特定需求用户的一种活动,其在社会总体运行过程中起到稳定信用结构的作用。在新型科技背景下,大数据、算法等技术因素为传统征信行业提供了新的支撑,使得个人信用信息涉及范围扩大、精确度进一步提高,社会总体信用结构进一步发展,由此金融征信业呈现出网络化、数据化的趋势。同时,个人信息数据逐渐成为了征信信息收集与处理的主要形式,如中国人民银行征信中心数据库包含了3000家以上金融机构数据、近10亿条自然人征信信息、30万条企业信息等。然而,征信系统的网络化与征信信息的数据化也对个人征信信息造成了一定不利影响,如网络信贷融资行业中体现出的个人信息泄露、个人征信信息评价偏差、隐私权侵害风险等,对整体金融秩序的稳定性造成破坏。

现有新科技背景下个人征信信息保护的国内外研究总体上形成了“技术+法治”的双向体系共识,但在个人征信技术的伦理特点以及相应的法律治理理念和具体制度路径方面存在差异。同时,已有研究的分析内容仅停留在互联网、大数据等科技因素外观特征层面,忽略了算法这一动态因素在数字化个人征信领域中的技术核心地位。因为算法是大数据、人工智能等新型技术的物理层基础,具体来说,包括个人征信在内的大数据技术应用领域在理论层面存在两个基本命题:其一,深度学习算法建立在“数据”的基础之上。此处的“数据”是《中华人民共和国数据安全法》(以下简称《数据安全法》)第3条“以电子或其他形式对信息记录”中的数据,即其并不涉及到数据处理、数据加工、数据应用等行为,而仅仅是数据本身;其二,大数据技术又是以算法技术为基础,以求得前瞻性结论并为具体决策提供指引和预期。也就是说,大数据技术应用具有“数据—算法技术—大数据处理分析”的结构特点。然而,现有研究仅仅在大数据处理分析阶段探讨个人征信信息保护缺失及其社会风险,并未深入至算法这一技术驱动核心层面。数字时代下个人征信信息保护法律理论缺乏对风险形成根源的算法技术的关注与探讨,造成了“技术+立法”治理模式中技术要素的根本缺失。

二、个人征信信息算法风险的现实表征

(一)算法的自动化引发信用歧视

算法的主要技术特征自动化机理大大提高了计算机和软件程序处理和预测社会现象、便利社会运行和经济运营的能力。① 然而,这种自动化功能也是导致算法信用歧视的主要原因之一。其首先引发了算法越权,其次在越权的基础上基于不合理、不客观的评价方法和评价标准体系,对客户进行主观和片面的信用评价,由此产生缺乏正当性的差异化信用定性风险。具体来说,在算法越权方面,算法自动化功能突破客户授权范围。从个人信用信息采集的缔约过程来看,信息采集双方就授权内容及其范围的私法依据表现为个人终端设备上显示的用户须知类电子协议,该协议以格式条款为基础,并不具有协商空间。然而,个人信用信息采集方与被采集方之间存在相当程度的信息不对称现象,以及由技术能力差异造成的契约履行能力不对等现象。那么纵使个人信息主体具有信息采集时所签订的电子协议保障,但在征信机构通过算法进行个人信息越权采集和利用时,个人信息主体难以察知和维权,而征信机构则有通过算法自动化采集和利用个人信息以最大化其数据价值的技术能力与动机。可见,征信机构的技术和信息优势,以及较大的收益和违法成本之比,是征信机构利用算法进行越权操作的原因所在。虽然《征信业务管理办法》第23条规定,信息使用者应当采取必要的措施,保障查询个人信用信息时取得信息主体的同意,并且按照约定用途使用个人信用信息,但此处存在三方面矛盾。其一,征信主体的合规风险,即如果是未取得合法资质的信息收集者,那么第23条便丧失了适用基础,事实上形成了算法自动化在征信领域的滥用;其二,大部分征信主体并未遵守“作出引起信息主体注意的提示”的规范,而是将其隐藏在自动化收集技术的背后,如部分涉及征信数据采集的客户端采取的是“登录即视为同意相关条款”的技术模式;其三,协商空间的压缩,直接违背了“按照信息主体的要求作出明确说明”这一规定,算法自动化直接将信息主体与征信主体之间的互动链接进行切断,形成了不合法的强制力。

(二)算法的相关性引发错误评价

算法的相关性是通过大量客户数据收集,将已有的数据与评价结果、评价等级等进行自动关联来实现,但这种关联可能导致评价错误。究其原因便在于,算法自动化关联形成的数据画像虽然具有相关性,但不具有科学的因果性。算法与人工智能技术无法替代人类理性意识,理性认识通过感性获得认识质料,并通过质、量、关系、模态建立内在联系,这种现象定立具有自然性的因果联系。而算法采用的相关性是通过历史数据的堆积与归纳,形成各种数据结果类别,对于新的对象,算法只能将其划归为最适合的类别,这种以数据归纳和相关性为基础的评价手段,因不具有因果性的科学性依据,极可能在大量数据处理的过程中出现较多错误。与引发歧视的算法自动化功能不同的是,该错误问题不涉及算法控制者的主观性评判问题,而是单纯的技术逻辑问题。以美国在线贷款平台upstart为例,其信用评价过程便是通过算法对申请人偿还能力有关的任何数据进行自动化获取与分析,根据其CEO兼联合创始人Dave Girouard所介绍的,其算法考虑两方面数据:其一是总体大数据;其二是可用于预测的单个数据。但现实中,美国的算法模式评价体系并不完善,其原因就是算法的评价是自动、标准化且非统一的:2013年美国联邦贸易委员会数据显示至少五分之一的美国人信用报告具有错误,虽然Girouard介绍了进一步的算法完善路径,但上述错误都是征信机构过于依赖相关性、忽视了因果性所引发的不利后果。②

(三)算法的隐蔽性引发信息泄露

征信活动的客体是个人征信信息,在大数据等新技术背景下,其可能是有关个人征信与信用的任何数据信息,由征信主体或机构借用预设算法对其进行爬取与挖掘。从微观上看,征信业不仅服务国家总体,也服务于各类参与信用活动的社会个体,其中包含了较为广泛的私法适用空间,但私法原则如意思自治及个人人格权利保障等并未得到有效体现,主要表现为信息数据的泄露与滥用方面。具体来说,信息主体所产生的所有信息与数据中,部分内容即使与信用活动有关,在法理层面上也是不应当进行采集的,如私密信息等。以美国为例,美国1970年《公平信用报告法》明确规定了征信信息的具体范畴,以及“禁止收集”的相关信息类别;《中华人民共和国民法典》(以下简称《民典法》)也突破了传统民法领域的原则性规定,确立了隐私权的保护,如第1032条;并在个人信息保护中明确了相关信息的分类适用,如第1034条。关于征信信息保护,《民法典》设立了相关准用性规范,如第1030条(适用本编有关个人信息保护的其他规范),相关典型的参照条款包括第六章第1038条,即信息处理者的信息安全保障义务等。《数据安全法》第30条也强调,风险评估报告应当包括处理的重要数据的种类、数量,开展数据处理活动的情况,面临的数据安全风险及其应对措施等,同时第32条规定,收集、使用数据要限定在法律法规允许的范围内,不得超过限度。《征信业务管理办法》第24条规定,信息使用者使用征信机构提供的信用信息,应当基于合法、正当的目的,不得滥用信用信息。然而,以算法与数据技术为依托的大数据征信信息采集与应用行为却无法完全满足这一要求。因为算法的运用具有隐蔽性,其可能在获取客户授权后接入其移动终端自行获取所有数据,致使客户信息被篡改和泄露,侵犯数据信息相关权利,还有可能间接地引发其他方面权益的损害,如信用等级下降。利用算法、数据技术等在履职过程中秘密窃取的信息,极易超出《民法典》《数据安全法》《征信业务管理办法》等所规定的类型化规范范围,其隐蔽性并非仅涉及道德性,同时也具有很强的技术特性,现实中还有很多典型案例中被侵权人都是在不法行为后很长一段时间才因催款等间接迹象了解到自己的权益被侵犯,且该类不法行为规制难度较大。

(四)算法的技术垄断性侵蚀个体信息权利的自决性

“自决”的概念很早便被运用在个人信息保护、征信信息采集等一系列法律关系中,具体涵义为获取信息主体的“同意”或“授权”。如美国1998年《消费者征信就业澄清法》规定信用报告必须获得信息主体的同意与授权,2018年《经济增长、监管救济和消费者保护法案》进一步增强了自决权。我国《民法典》也在第1035、1036、1038条等条款中规定了个人信息处理、篡改、提供给第三方等行为的自决条件。也就是说,自决性条件已经成为了有关征信信息保护的国内外共识,在我国也不例外,自决原则已成为信息保护规范体系中的基本原则之一。但是大数据征信领域算法的技术垄断性决定了其并不能为信息主体提供自决的空间。因为其处理与分析数据的高速性与巨量性,每一项信息与数据都满足自决权条件要求显然不具有可行性,并易被算法自动忽略。另外算法的专业性特征造成了技术垄断,其内部逻辑如代码等一般难以得到充分的公开与披露,且即使进行披露也难以为信息主体所理解,这样就形成了信息壁垒和信息不对称,征信主体或算法创造者、使用者较之信息主体具有了技术优势,信息主体的自决权进一步受到侵蚀。

三、算法时代的个人征信信息法律保护

(一)完善立法:整合法律规范形成统一化

第一,提高相关法律位阶。立法层面,法律位阶不仅涉及到法律法规的立法程序,还涉及到其管辖的区域与层级,并进一步关系到所调整社会关系的具体深度与相关法律权威。与发达国家相比,我国有关个人征信信息保护、征信行业规制规范的法律法规,更多地集中在行政法规与规章方面,总体上看法律位阶较低。《民法典》虽法律位阶较高,但有关征信信息保护的规范仍属于准用性规范。准用性规范在没有规定具体的行为模式的情况下,其规制效果并没有专门性规范那般具有针对性,同时参照条款在一定情况下适用性较之专门性规范会更低。故应当适当提高征信信息保护规范的法律位阶,以提高规范条文的强制力与法律权威,减少算法自动化规避法律规范的可能性,维护总体金融信贷评价体系。第二,统一征信领域法律概念与规范。在我国现有的征信信息保护相关法律规范的相关规范体系中,不同地区、不同层级对相关标准明确程度不一,或本身概念与判定关系不明确,可能为以算法自动化运行为基础的边缘化征信活动提供可乘之机。如《网络安全法》有关“必要”的原则,在现实操作中并不十分明晰;《征信业务管理办法》第24条中的“正当的目的”也未提供相应的判定标准。同时,格式合同的“诱导性”判定标准不一,难以形成全国范围内的共识;另外一些技术性标准在全国范围内也难以形成统一,如匿名化操作、数字化保密程序等。相关规范实行全国统一化、标准化将有利于相关概念的明确,防止灰色机构的产生以及边缘行为的发生,减少私人化与歧视化的评价。第三,在立法过程中吸纳专门型人才,对相应的专业算法技术因素纳入考量。现阶段需要纳入立法层面考虑的网络化因素中,最主要的就是信息共享的相关概念。征信本身的内涵即为信用信息共享,并将其用于特定目的或出具特定报告。但事实上,信息共享本质上是一种技术行为,其涉及到信息主体、信息共享平台、信息流转机理、信息追踪等一系列技术问题,单纯地利用信息公开相关法律规范对其进行调整,实质上是忽略了技术因素。为解决这一问题,应当在立法者群体中吸纳网络化、信息化与数据化人才,在立法层面上提供专业意见,将信息化与数据化因素纳入立法考量,为执法层面的网络化监管提供法律依据与合法性基础。

(二)区块链应用:构建分布式储存布局

区块链完全符合《数据安全法》第9条有关协同治理体系、共同參与数据安全保护工作、共同维护数据安全以及促进发展的良好环境的要求。就技术可行性层面而言,区块链采用的是分布式储存、点对点传输、加密式算法等技术模式。在新型社会背景下,区块链技术可用于多方面领域,如智能合约、信用机制与体系重构等,因其不可篡改的公平性特征,区块链技术与分布式框架、新型数据库应用体现出极强的潜力③,《区块链信息服务管理规定》中被认定为“核心技术自主创新的重要突破口”。其在以个人信用信息收集与类型化、金融信贷、数据信息处理、算法与大数据等为主要内容的新征信领域,也体现出了极大的应用潜力。具体操作层面,为了应对算法引发的征信信息风险,应对《民法典》中涉及个人征信信息保护的一般性概念进行细化和分类。将可采集与处理的征信信息、不可采集或只有极为特殊的情况下才能采集处理的信息(如《民法典》规定私密信息)分别采用公有链和私有链进行储存。公有链与私有链是区块链依据开放程度进行区分的两种类型,前者的特征是公开性、人人可参与和监督,并体现出极强的去中心化特征④,避免了被篡改的风险;后者仅限个人内部封闭式参与,以中国人民银行数字货币为典型,可以有效解决信任问题。在对不同类型信息进行归类储存后,构建其数据层、网络层、共识层、激励层、合约层与应用层,以实现数据信息的分布式储存。在我国立法为征信领域提供上述操作体系的合法性的背景下,可以有效实现运行与监管目的:一方面,公有链的信息数据可以避免被篡改,评价体系更为统一,实现网络化的协同效应;另一方面,私有链的个人写入权限与去中心化可以避免隐私侵权。

(三)行业协会:构建新型“政府+市场”双轨制协同规范体系

算法对征信信息自决权与信息处理透明原则的侵蚀,主要基于其技术性、专业性与信息垄断特性,因此需要构建专门的审查机构与规制机构,并使该机构同时具有技术性特征与市场化特征。征信市场需要的首先是优良的规划与格局,现阶段虽然已经初步形成了“政府+商业(市场)”的双轨驱动格局,但数据与算法背景下的主体、利益结构等均十分复杂,相关合作与交互经验的缺乏、政府与市场主体“裁量权”的平衡缺失,使得现有的双轨驱动的征信主体格局体现出新型风险与隐患。在我国的征信领域,传统的监管机构主导管理模式已经逐渐体现出市场化的特征,从本质上看,市场化的运行与规范机制具有其优越性,如技术性的运用和数据共享机制的价值等。但是我国缺乏单独的征信组织,多元化的监管主体缺乏有效的协作机制,形成了“各自为政”的态势。一些其他因素如概念与理论方面的问题,提高了相关主体的自由裁量权力,执法与审查方面难以形成统一化、系统化与协同化。较好的解决方案是构建专门的监管主体机构,并基于此形成新型的统一化审查机制。可以借鉴美国的FTC(联邦贸易委员会)、CFPB(消费者金融保护委员会)对征信行为、征信数据库与其他信用服务的制约,其中FTC是专门的征信监管部门⑤。而我国的征信监管部门主要是中国人民银行征信监管局,但其作为央行的内设机构,并且与市场化主体的协同机制未搭建起来。具体运行方面,则需要发挥不同审查与规制主体的协同作用。如《数据安全法》第9条所强调的,我国应当实现数据安全的协同治理体系。在我国征信业“政府+市场”的双轨制布局中,纠纷处理机构以及申诉机构仍然以政府机构为主导,但根据我国国情,基于市场化的维权体系可能并不适应。同时,单纯的行业自律行为与协会纠纷处理机制虽然在一定程度上可以防控信息破坏风险、降低执法压力,但在我国的司法层面上其并不具有相应的权能。故应当将政府机构、市场纠纷处理主体、协会等自律机构维权渠道相统一,一方面可以发挥我国法律权威效能,一方面可以发挥市场化的纠纷处理效率价值。

注释:

① Merle Temme, Algorithms and Transparency in View of the New General Data Protection Regulation, Europe Data Protection Law Review, 2017, 3, p.473.

② Dan Feldman, Eldar Haber, Measuring and Protecting Privacy in the Always-On Era, Berkeley Technology Law Journal, 2020, 35, pp.197-250.

③ 参见赵磊:《区块链类型化的法理解读与规制思路》,《法商研究》2020年第4期。

④ Christine Kumar, The Automated Tipster: How Implicit Bias Turns Suspicion Algorithms into BBQ Beckys, Federal Communications Law Journal, 2020, 72, pp.97-122.

⑤ 參见姚朝兵:《个人信用信息隐私保护的制度构建——欧盟及美国立法对我国的启示》,《情报理论与实践》2013年第3期。

作者简介:李牧翰,湖南大学法学院博士研究生,湖南长沙,410000;黎四奇,湖南大学法学院教授、博士生导师,湖南长沙,410000。

(责任编辑  李  涛)

3721500338216

猜你喜欢
算法
国际主流轧差算法介绍:以CHIPS的BRA算法为例
利用数形结合明晰算理
《算法》专题训练
例说算法初步中常见的易错点
清华大学开源迁移学习算法库
Travellng thg World Full—time for Rree
算法框图型扫描
《漫画算法:小灰的算法之旅》
学习算法的“三种境界”
算法框图的补全