证据法视野下的算法规制

2021-11-24 11:11王士博
关键词:规制法官证据

王士博

一、问题的提出

我们已经进入“算法统治的时代”,算法应用的场景遍及社会的各个方面。在证据场景中,犯罪行为、犯罪现场从线下发展为线上,犯罪行为在虚拟空间留下海量的电子数据痕迹。与传统单独在物理空间的犯罪相同,这些海量的数字痕迹需要经过算法进行结构化分析,才能显示其证据价值。算法侵入证据本体,产生了算法衍生数据产品,即算法证据①学界通说认为对算法分析电子数据产生的算法产品称为算法证据。但是笔者认为,算法证据没有抓住其本质,算法证据本质上是使用算法对数据分析而产生的,应当称为算法证据较为适宜。否则,算法证据称谓有误导之嫌,误认为算法证据本身的数据量很大,其所包含的信息量也很大。对于算法证据的讨论,见刘品新:《论算法证据》,载《环球法律评论》2019年第1期;林喜芬:《算法证据在刑事司法中的运用初探》,载《法学论坛》2021年第3期;元轶:《证据制度循环演进视角下算法证据的程序规制——以神示证据为切入》,载《政法论坛》2021年第3期。。作为在证据场景尚显“年轻”的技术,算法不论在证据法学理论上还是在审判实践中,都存在一系列疑难问题。

在证据领域,绝大多数学者探讨的对象是算法证据。如算法证据的属性定位、算法证据的关联性内容等。②参见何家弘、邓昌智等:《大数据侦查给证据法带来的挑战》,载《人民检察》2018年第1期;孙谦:《新时代检察机关法律监督的理念、原则与职能——写在新修订的人民检察院组织法颁布之际》,载《人民检察》2018年第21期;徐惠,李晓东:《算法证据之证据属性证成研究》,载《中国人民公安大学学报(社会科学版)》2020年第1期;章安邦:《人工智能时代的司法权嬗变》,载《浙江工商大学学报》2020年第4期。就算法规制而言,理论界着墨不多。与之形成鲜明对比的是,对算法的一般化法律规制讨论已经形成规模。理论界出现这种现象的原因就在于学者们没有将算法规制的讨论建立在场域维度之上。算法作为一种人造技术,是替代人类完成任务的代码程序。应用在不同的场景,其所追求的目标价值不同,算法的选择自然不同。此外,在不同的场景中,对算法的主要争议问题有很大差异。如在证据场景中,商业秘密价值位阶低于程序正义价值,所以在证据场景中,算法黑箱并非主要争议。可见,算法本身以及所涉问题伴随场景变化差异化明显。因此,算法的法律规制问题需要建立在场景化思维基础上。③关于算法规制的场景化论证,参见丁晓东:《论算法的法律规制》,载《中国社会科学》2020年第12期。

明确了算法的规制具有场景区分性之后,我们需要将算法“转译”为证据法上的问题。对于法律来说,没有全新的领域或概念,问题是法律如何对其进行解释,其是否在抽象的法律概念涵摄范围之内。除此之外,从法官事实认知方式的角度来说,法官对算法的认知,是在既有的认知框架之中。因此,在讨论算法规制之前,传统上法官对科学技术如何认识,这是我们选择算法规制路径的前提。在此基础上,笔者结合证据发展的历史经验,依据我国具有的情况寻求算法的法律规制之进路,这是降低算法证据对事实认定风险的重要制度支撑。

二、算法与证据系统的耦合的方式与风险

在证据场景中,技术可能以三种主要方式重塑司法系统。首先,在最基本的层面上,技术帮助向参与司法系统的人提供信息、支持和建议(支持性技术);其次,技术可以取代以前由人类执行的功能和活动(替代技术);最后,在第三个层面上,技术可以改变判断的方式工作,并提供非常不同形式的正义。①See Sourdin Tania, Judge v Robot? : Artificial intelligence and judicial decision-making,41University of New South Wales Law Journal 1114,1117-1119(2018).算法应用于证据分析属于第二种即替代技术,其替代了人类执行的数据分析的活动,这种替代性技术对法官事实认定的准确性产生了一定的风险。

(一)算法如何计算证据

算法是为了让计算机完成某项任务而构造的指令。从技术上来看,构建算法的一般步骤是:数据特征→数学模型→编程。依据对数据特征提取的主体区分,算法分为机器学习算法和人工设计算法。机器学习算法自主地从数据中提取特征,不断地将学习到的数据特征进行建模并进行优化迭代。为了使机器学习算法能够模仿人脑进行思考,计算机科学家将认知科学引入到机器学习过程之中,以模拟生物神经系统对真实世界的交互反应。②参见崔聪聪、许智鑫:《机器学习算法的法律规制》,载《上海交通大学学报(哲学社会科学版)》2020年第2期。人工设计算法是将提取的数据特征关系转化为数学模型,再根据数学模型进行代码转化。实际上,人工设计算法模型构建的过程就是人类将逻辑转化为代码的过程,是人类思维的数字镜像。

一是算法将证明的逻辑由价值分析转换为数理逻辑。新康德主义的海德堡学派的重要代表人物拉德布鲁赫认为:整个法哲学的基础是对法的价值的观察。法官对事实的判断是一种价值判断,综合指控的证据而得出具有法律取向性的意见。在价值判断过程中,法官不拘泥于事实的细节,运用经验和逻辑,只要符合法律所规定的构成要件即可做出判断。当然,这种价值判断往往是模糊和不可言传的。而算法证据所证明的逻辑是一种精细化的数理逻辑,算法证据本质上是大量数据聚合而生成的。数字形态的电子数据,经过目标函数的计算,聚合成为不同的数据关系。算法证据是以数学计算而得出的可行性计算结果,是以数学公式进行证明。所以,当算法进驻证据领域之后,证据的证明不得不从价值分析转向数理分析。

二是证据论证的方式由逻辑转换为算法模型。在物理世界,立法者通常使用的概括工具就是所谓的“类型化”,这些规范模型将无限变化的社会世界划分为特定类别。社会之所以需要法律,很大程度上同样是因为真实世界包含的变量太多,需要过滤、清理,形成有效的认知模型。③参见蒋舸:《作为算法的法律》,载《清华法学》2019年第1期。与法律的认识模式相同,算法对数据的分析首先需要构建模型。模型“大胆地从混沌之中创建秩序”④马长山:《迈向数字社会的法律》,法律出版社2021年版,第201页。,是数据结构的抽象化模板,算法模型提供了一个规范的数据结构。以自动驾驶汽车的算法为例,其是根据不同的路面情况预设汽车不同的反应,在面对“电车难题”时并非算法自主选择,而是由算法的设计者做出选择。因此,从算法程序运行的逻辑上来看,算法设计者将现实世界的逻辑镜像映射到算法模型中。在数字世界里,算法模型就是数据分析的大前提。而算法模型构建的依据是《刑法》中的构成要件,将类型化危害行为映射在数据世界的数据关系模型化。在算法证据形成之前,危害行为与数据关系的关联性通过编程体现在算法模型中。也就是说,算法模型实际上与构成要件是数字孪生的关系。①通过数字化的手段对现实世界中的对象在数字世界中构建对应的实体,借此来实现对现实世界的了解并以此促进决策优化。见衣俊霖:《数字孪生时代的法律与问责——通过技术标准透视算法黑箱》,载《东方法学》2021年第4期。如在组织、领导传销活动罪②《刑法》第224条规定:“组织、领导以推销商品、提供服务等经营活动为名,要求参加者以缴纳费用或者购买商品、服务等方式获得加入资格,并按照一定顺序组成层级,直接或者间接以发展人员的数量作为计酬或者返利依据,引诱、胁迫参加者继续发展他人参加,骗取财物,扰乱经济社会秩序的传销活动的,处五年以下有期徒刑或者拘役,并处罚金;情节严重的,处五年以上有期徒刑,并处罚金。”中,其犯罪构成行为特征有:组织者或经营者要求被发展人员发展其他人员,并以发展人员的数量作为计酬返利依据;组织者或经营者要求发展人员缴纳费用;形成层级,以下线的销售额计算上线报酬。这些行为在银行留下了资金数据痕迹。因此,传销犯罪行为相对应的资金数据交易特征有资金汇入特征、资金特征、返利特征,将这些资金数据特征数学模型化为算法模型。由此观之,在数字场景中,算法模型是数据的类型化规则,通过规则的代码转换,使其由现实世界的法律规则转变为数字世界的代码规则,构成要件被重构为0和1的组合。

(二)证据场景下算法风险的现实隐忧

具体到微观层面,算法技术进入司法运行过程的路径,以及算法技术本身的可靠性问题,对法官的事实认定都产生了一定的风险。

一是企业分担司法权力的正当性问题。以往,侦查机关通过内部设置的鉴定机构掌握法庭上的科技,但是算法技术的出现打破了传统模式下技术的“隶属关系”。科技企业与侦查机关合作,为侦查机关提供算法技术支持。科技企业通过技术支持的方式在实际上参与了国家司法权力的运行。实际上,2018年最高法院发布《关于互联网法院审理案件若干问题的规定》,标志着企业提供的电子数据存证软件获得司法认可。③《关于互联网法院审理案件若干问题的规定》第11条第2款规定:“当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。”但是企业参与司法权力运行的正当性仍未论证。从域外来看,美国司法与科技企业合作,导致了被告人对质权与商业秘密的价值冲突。从实践来看,私主体参与到司法运行过程可能引发取证主体的合法性与正当性问题。如在快播案中,侦查机关委托文创动力公司为淫秽物品鉴定人提供转码服务等技术支持,被告人王欣的辩护律师提出,该公司被告人与快播公司的竞争对手是公司存在客户关系,因与本案存在利害关系,所以取证主体不合法,所取得证据不能作为定案根据。①参见谢登科:《论电子数据与刑事诉讼变革:以“快播案”为视角》,载《东方法学》2018年第5期。目前,加强警企合作共治,是新形势、新任务下,公安机关贯彻党的群众路线的新举措。在警企合作的大背景下,各地公安机关与当地的科技公司合作或者购买软件,侦查机关所使用的算法技术往往是私营技术公司开发的软件。司法权力外包给私营公司是否具有正当性存疑。此外,在警企合作开发算法模型过程中,对于采用何种算法和模型的建议来自于侦查机关自身司法经验的积累,而其经验的局限性以及本身的选择性执法倾向及司法偏见会自然地影响其对于算法功能和分析模型的把握。②参见江朔:《大数据在刑事司法体系中的应用及其问题》,载《月旦法学杂志》2020年第9期。在笔者调研中,为了便利侦查,进行各种场景的算法构建,大数据实验室直接设置在公安机关办公区。以消除算法使用者与算法设计者在物理场域分离的方式,来达到对算法技术控制的目的,实现算法使用者与算法设计者合二为一,形成算法加侦查的合力。如此这般,算法模型体现的是侦查机关自身的价值偏好和司法经验,检察机关和审判机关没有参与其中,也就无法判断算法模型是否公平公正。在技术的加成下,公安机关移送的算法证据,检察院、法院无法对其审查,法院在审判阶段没有起到对前阶段程序移送证据的把关作用,将侦查机关收集制作的证据作为一种结论被法官认可,这违背了审判中心主义的格局,并且证据质量难以从程序上保障。侦查机关成为“技术中心”,渐渐地完成对检察院、法院的“技术占领”,恐有重新成为诉讼关系中心的风险。

二是算法的稳定性风险。算法的稳定性在于可验证性和可重复性,即相同的输入,其输出的结果是一定的。在机器学习算法中,特征参数之间的关系或者有哪些特征参数都是不固定的,是由算法自主性地利用统计学计算学习而生成的。实际上,机器学习算法也是学界主要争议的算法黑箱所产生的原因。具体来看,在刑事证据领域中,特征参数之间的关系是犯罪构成中危害行为映射在数据世界而产生的,这种数据关系是危害行为在数据世界留下的数据痕迹,结构化之后可以证明类型行危害行为。而机器学习算法机器输出结果不稳定,其无法证明既定的数据关系。可以预见,这种动态性的算法在学习过程中随着实践的推移而自动改变。这意味着两个不同的时间呈现给系统相同的输入可能导致不同的输出。即便在证据分析中使用人工设计的算法,但是算法可以产生许多种类的错误,包括粗心的错误(源于编码草率)、系统误差(源于算法内部缺陷)、随机误差(难以控制算法参数、数据、硬件而引起)等。③参见黄琪:《算法责任:规制误区与架构重建》,载《四川大学法律评论》2020年第1期。这就算法需要设计者不停地更新和补丁,有时因为侦查人员的需求而改变算法模型。算法的更新和改动是否会引起算法结果的变化,对算法更新之前的案件如何处理?

三、规制的起点:算法的证据法定位

科技的进步,经常在事实上创造出一个新的领域,但是将其“转译为法律事项”之后,可能仍然是法律老生常谈的法律解释问题。而转译工作的成败,不仅依赖于对证据法相关概念的性质判断,更重要的是算法的属性定位。①参见陈景辉:《算法的法律性质:言论、商业秘密还是正当程序?》,载《比较法研究》2020年第2期。在搜索引擎应用场景下,2003年美国搜索王诉谷歌案(SearchKing,Inc.v.GoogleTech.),“算法是言论”的主张得到法庭支持。在该场景下,言论自由成为在法庭上对抗算法规制的利器。在刑事司法人身风险评估场景下,2013年美国的威斯康辛州诉卢米斯案(Statev.Loomis),法官将量刑的COMPAS算法视为商业秘密。在该案的法官看来,商业秘密的价值位阶高于被告人正当程序权利的价值位阶,基于此,算法被视为商业秘密获得了与言论一样的对抗算法规制的保护效果。可见,算法的“转译”对算法规制具有方法论的框架意义。因此,证据法对算法的规制,也意味着需要将算法“转译”成证据法上的问题。

在证据法视野下,随着算法侵入证据本体,产生了算法衍生数据产品,即算法证据。证据法需要对算法的证据应用予以回应,并在证据法框架下对算法进行规制。既然承认证据法能够介入算法,那么关键的问题是算法在证据法中是什么?这个问题的答案决定了证据法介入算法的方式和标准。

(一)算法证据难以定位的理论根源

算法侵入证据本体所产生的算法证据,学界对此早有讨论。当然,对于新型证据材料的出现,无论从证据理论还是司法实践出发,都应当讨论其概念和属性,以便于对其进行归类,将其纳入法治化的轨道。学界对算法证据也进行了深入的讨论,但到目前为止,对于算法证据的种类归属问题仍无共识。

在2012年《刑事诉讼法》修改将电子数据作为一种新的证据种类之前,实践中电子数据已经作为认定事实的依据。学界对电子数据的证据种类归属问题也产生了分歧。同样范畴的讨论在算法证据中又开始盛行,有似曾相识之感。新型证据难以被传统证据种类所接受,这毫无疑问地又冲击了证据种类体系。实际上,证据种类体系在理论界饱受诟病,实践中所运用的证据种类已经超出法律对证据种类的规定。如情态证据②参见陈麒巍:《情态证据刍论》,载《中国刑事法杂志》2009年第1期。等辅助证据。换言之,法律对证据种类的规定存在与实践脱节问题,不能回应实践中出现的证据。这才是学界不断地从立法论的角度主张设立单独的算法证据种类的本质原因。

我国《刑事诉讼法》对证据的分类采取了细分的方式,且分类的标准不一致。一般认为,法律上区分证据种类的标准是“证据的表现形式”。证据的表现形式是人们感知、认识证据信息的方式。①参见林劲松:《法定证据种类的解释视角反思——以刑事诉讼为中心的分析》,载《浙江大学学报(人文社会科学版)》2016年第4期。也即证据载体。证据种类按照载体的形式分为电子数据、物证、书证、视听资料,而按照证据的提供主体将人证分为证人证言、被告人的供述和辩解、被害人陈述,按照产生的时间不同可以分为诉讼中产生的证据和案件发生时产生的证据。可见,证据的种类划分标准不统一,证据的分类标准之间具有重叠性。此外,这种细分的方式弊端在于各个种类证据的抽象性不足,造成了每个证据种类所能涵摄的范围过小。这也是每次新的证据材料产生时,学界需要重新讨论是否需要增加证据种类的原因。相比之下,按照各国证据法学上的通说,证据分为人证、书证和物证三大类别。对于算法所产生的算法证据,在美国称为机器证据,是人证中的专家证据。质言之,我国《刑事诉讼法》对于证据种类的划分,其自身的体系较为脆弱,其应对科技创新所带来的挑战较差。可以预见,随着科技手段认定证据的增多,以原生态形式展现的证据会越来越少,而经过科技技术手段分析的证据将会激增。

(二)证据信息有序化分析方法——算法的证据属性

从证据的构成角度来说,任何证据都是证据信息和证据载体的有机统一。②参见陈瑞华:《刑事证据法》(第三版),北京大学出版社2018年版,第93页。但具体到电子数据和鉴定意见而言,构成要件有其特殊性。电子证据由电子证据的载体、技术层面的电子数据和电子证据内容构成。与普通证据由载体和信息内容构成不同,电子证据的内容在技术层面是按照编码规则处理而成的0、1数字组合。③参见褚福民:《电子证据真实性的三个层面》,载《法学研究》2018年第4期。因此,电子证据实际上是“双载体”,即物质载体和数字载体。而鉴定意见并非直接从案件事实本源所获得的信息,鉴定活动属于诉讼活动。如指纹鉴定,来源于案件事实的痕迹是指纹,对指纹进行特征的识别、比对,从而进行同一认定。在同一认定的过程中,指纹证据经过了专业技术性的解读,与我们感官所能直接感知的内容不同。鉴定意见的构成分为鉴定活动、鉴定意见内容和鉴定意见的载体(鉴定意见书形式或鉴定人口头形式)。④2021年《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第97条列举了对鉴定意见审查条款;第98条规定了不得作为定案根据的鉴定意见的九种情形。其中,要求审查鉴定机构和鉴定人是否具有法定资质,是否存在超出鉴定机构业务范围、技术条件,鉴定人是否具有相关技术或职称以及是否违反回避规定。这意味着鉴定意见包含鉴定主体。与此同时,刑事诉讼法解释还规定了鉴定的检材和样本是否可靠无污染,鉴定程序和鉴定过程是否符合专业规范,这些审查规则是鉴定活动问题。另外,鉴定意见的内容是否与案件有关联,也是着重审查的内容。由此可以看出,鉴定意见的结构分为三个层次,即鉴定活动、鉴定意见内容和鉴定意见的载体。

如果我们使用信息论的分析框架,把证据收集和分析看作信息的获取、加工、处理过程,证据信息分析实际上属于是信息内容处理。信息内容处理包括信息分析和信息综合。法官进行事实认定的依据是证据载体荷载的信息。证据规则是围绕证据信息保全以及如果正确地认识证据信息。从事实信息理论的视角来看,所谓的鉴定意见和勘验检查笔录,只是对物证以及与犯罪有关的现场的案件事实信息的识别和提取、固定,并不是从案件事实本源获得的事实信息。①参见熊志海:《信息视野下的证据法学》,法律出版社2014年版,第5页。因此,以证据的构成为标准,证据可以分为两类,原生性证据和意见类证据。电子数据和鉴定意见分别是其典型代表。②选取这两类证据种类的原因是:算法证据分析的对象是电子数据,而算法证据的构成与鉴定意见相似,算法证据也由算法、算法证据的内容以及算法证据的载体组成。原生性证据包括:物证、书证、证人证言、被害人陈述、犯罪嫌疑人、被告人供述和辩解、视听资料、电子数据。意见类证据包括:鉴定意见、勘验、检查、、侦查实验笔录。之所以做出这样的区分,是因为证据的结构影响证据审查判断的层次。原生性证据审查判断有两个层次,证据载体和证据信息,证据载体的真实证明了证据信息的真实可靠,法律对其收集以及证据保全做出了规定。但是在意见证据中,与原生性证据相异的是,证据的构成要件多了证据分析活动(鉴定活动)。因此,对意见类证据的审查判断有三个层次,即证据载体、证据分析方法和证据信息。

犯罪事实一旦发生,犹如信源发出一定的信息,信息必须依附于一定的载体才有可能到达信宿。③参见卞建林:《证据法学》,中国政法大学出版社2002年版,第51页。信宿就是依据证据认定事实的法官,法官是这一信息传导的被作用主体。申农所确定的信息量表达公式与热力学中的熵的公式一致。在热力学领域,一个系统总是从有序到无序,这一过程中熵是增加的。热力学领域的熵是系统无序化的度量。犯罪行为发生的过程就是证据信息无序化的过程,也就是熵增的过程。而恰恰相反的是,信息总是需要系统从无序变为有序才可以显现。也就是说,一个系统越有序,熵值越小,而其信息量越大,这就与热力学中变化的方向相反。正如一个系统中的信息量是它的组织化程度的度量,一个系统的熵就是它的无组织程度的度量;这一个正好是那一个的负数。④参见周怀珍:《信息方法的哲学分析》,载《哲学研究》1980年第9期。也就是说,将犯罪行为留下的痕迹进行收集并解读,这是一个信息有序化的过程,也就是负熵或者说熵减的过程。

以信息的运动作为分析和处理问题的基础,完全撇开对象的具体活动形态,把系统的有目的的运动过程抽象为信息的变换过程。⑤参见李琳:《证据方法的科学维度》,法律出版社2010年版,第175页。质言之,信息论将证据收集、处理的过程抽象为信息的运动过程。算法分析海量电子数据的过程同样也是“熵减”,将案件产生的混杂的电子数据结构化,这一信息分析过程将各个主体之间的关系进行梳理,并以可视化的方式展现。以传销犯罪中的资金交易数据分析为例,其算法模型需要体现资金汇入特征、资金特征、返利特征。经过算法模型的分析,输出数据的可视化可以清晰地展现哪些账户符合传销资金交易特征,这些账户就是侦查人员重点侦查的对象。

因此,笔者没有就事论事地讨论算法侵入证据本体所产生的算法证据的种类归属问题,而是基于信息论的角度对证据的概念进行阐释。信息论的分析框架淡化了证据的种类归属之争,可以回归证据证明的本体——证据信息。算法属于信息分析方法的一种,但是基于保证证据信息的真实性,也需要对算法进行法律规制。

四、算法的系统性规制

算法的规制并非能够通过赋权或设置算法监管机构就可以完成,只能通过系统性的规制措施,从多个主体、不同角度寻找既有的技术规制土壤,根据算法与传统技术的区别,对法律规则制度调适。算法规制的难点在于如何避免陷入技术泥潭同时又不至于对代码的运作逻辑过度简化。在警企合作研发的算法软件中,界面、数据、模型的三层架构形成了一种天然的算法黑箱。数据和模型在黑箱内部,黑箱的边界是交互界面,在物理世界和数字世界之间形成一道天然的隔阂。证据发展的历史带给我们的经验是,越来越需要在技术侵入证据本体之初就从深层次对其影响进行评估考量,思索在现有证据评价实践基础上进行政策和法律调适的可能性,推动技术与证据系统融合。在接纳技术发展的同时,降低技术对事实认定准确性的负面效应。

规制的节点决定规制的路径。在证据场景下,算法的规制节点选择是算法进入诉讼之前还是算法进入诉讼后?如果规制节点选择算法进入诉讼程序后,意味着规制的对象是算法证据。对算法证据的规制有三条路径:证据能力规则、证明力规则和证据排除规则。然而具体到我国的证据审查实践,法官以证据之间相互印证认定案件事实,算法证据的审查实际上与其他传统证据无法分离。①笔者在调研中发现,很多法官对算法证据不明所以,认为算法证据就是电子数据,对算法证据的生成过程不了解。试想,对于同一待证事实,法官面对两种证据:算法证据和传统类型证据,法官无法运用传统的证据评价方法评估算法证据。在这种情况下,法官似乎只能更倾向采信能凭借自己经验判断的传统类型证据,并抵御算法证据的入侵。他们必定会趋利避害,选择一种更少个体主观性,而容易为大家所认同的证据认知方法。因此,在实践中,法官算法证据与传统证据相互印证为由予以采信,规避了对算法证据的单独审查。以美国卢米斯案为例,在卢米斯案中COMPAS量刑系统被嵌入美国的司法审判过程,审判结果是软件的算法黑箱和法官的大脑黑箱共同作用之下形成的。算法是否侵害了卢米斯的权益是模糊的,同时也难以分清量刑算法具体的责任比例。

(一)算法规制的两种模式

就证据制度的发展史而言,从神示证据制度、法定证据制度到自由心证证据制度,科学技术发挥着重要的推动作用。可以说,在证据法视野下对算法进行规制是一个老生常谈的话题。根据规制节点的不同,可以大致分为两类:技术型规制与转化型规制。前者关注算法的内在设计规则,在算法的设计阶段进行规制。后者关注算法产生的外部行为和后果,其规制的节点具有滞后性。

在立法层面,我国对算法规制的立法模式属于技术性规制。2019年1月1日实施的《电子商务法》第40条规定了搜索类算法的明示义务和推荐算法的自然结果提供义务①《电子商务法》第18条:“电子商务经营者根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务的搜索结果的,应当同时向该消费者提供不针对其个人特征的选项,尊重和平等保护消费者合法权益。电子商务经营者向向消费者发送广告的,应当遵守《广告法》的有关规定。”第40条:“电子商务平台经营者应当根据商品或者服务的价格、销量、信用等以多种方式向消费者现实商品或者服务的搜索结果;对于竞价排名的商品或者服务,应当显著表明广告。”见张凌寒:《权力之治:人工智能时代的算法规制》,上海人民出版社2021年版,第230-231页。。2021年7月16日国家市场监管总局等七部门联合印发《关于落实网络餐饮平台责任切实维护外卖送餐员权益的指导意见》,其中规定了要科学设置报酬规则,优化算法规则,不得将“最严算法”作为考核要求,要通过“算法取中”方式,合理配置订单量、在线率和准时率等要素。2021年7月28日最高法院发布《最高人民法院关于审理使用人脸识别技术处理个人信息相关民商事案件适用法律若干问题的规定》,尽管是对民事审判实践的规范,但是有算法规制的导向意义。文件规定了人脸识别算法技术应用的场景限制,并设定人脸识别技术需要经过自然人或其监护人的“单独同意”规则。

在理论层面,对算法进行规制的讨论中,算法透明和算法责任分别是技术型规制与转化型规制两类路径的典型代表。在具体的算法规制制度设计上,有学者倡导成立独立的算法审查机构,②参见孙建丽:《算法自动化决策风险的法律规制研究》,载《法治研究》2019年第4期。赋予算法解释权。③参见解正山:《算法决策规制——以算法“解释权”为中心》,载《现代法学》2020年第1期;许可,朱悦:《算法解释权:科技与法律的双重视角》,载《苏州大学学报(哲学社会科学版)》2020年第2期。上述这些制度设计对策暗含着前提:既有的权利体系和机构无法对抗算法所带来的风险。当然,在算法技术发展尚未成熟之时期,规制算法的理论是开放性的,学者们对技术问题仁智互见,有利于学术的繁荣。但是,这些制度设计论证的逻辑上具有重大缺陷,即没有论证既有的制度或机构无法规制新兴的算法技术。对法律客体规制的实现并非简单地赋权或设置机构就能实现,这种“另起炉灶”式的制度设计是对整个既有的法律体系的“背叛”。以“算法安全委员会”为例,学者未对既有的监管体系进行检视,并且该机构的性质、隶属关系以及职权不明,这就造成该对策有不切实际的危险。因此,具体到证据领域中,算法规制问题需要廓清规制体系上的学术迷雾,并重点以证据法中既有的技术规制制度为视角,对算法规制与制度契合与否进行分析。

从域外来看,欧盟属于以个人数据保护为导向的技术型规制模式。GDPR前言第71项表述为“自动化处理……应遵守适当的保障措施,其中应包括项数据主体提供的具体信息以及获得认为干预、表达其观点、对评估后达成的决定作出解释和质疑该决定的权利。”这一表述公认规定了算法的解释权,但是前言是否具有法律效力值得商榷。此外,GDPR第25条规定了“设计保护隐私”原则,其背后的思想是处理数据过程中保护数据的原则最好在技术被创设时就嵌入。①参见罗伟玲,梁灯:《人工智能算法的伦理诉求和法律规制——以算法归责为视角》,载《中山大学法律评论》2019年第2期。欧盟依据GDPR成立了欧盟数据保护委员会(EDPB)。2019年6月EDPB发布了《针对GDPR第42和第43有关“认证”规定的指南》,②GDPR第42条第(1)款规定:“出于数据保护保密标志以及说明管理者处理者处理机制合法性的需要,成员国、监管机构、委员会的董事应当尤其在欧盟内激励数据保护认证机制。特别需要考量小微企业以及中等规模企业的特殊要求。”第43条第(1)款:“对于有关数据保护问题有一定程度经验的认证主体,在为了行使依据第58条获得的权力通知监管机构之后,可以公布及更新认证。成员国应当确定这些主体应当被以下至少一个机构授权:(a)第55条或者第56条有资格的监管机构;(b)符合欧洲议会通过的EC第765/2008规定、委员会通过的EN-ISO/IEC 17065/2012规定以及依据第55条或第56条监管机构所制定的额外要求的国际认证主体。”认证的范围是个人数据、处理个人数据的技术系统和处理行为相关的过程和程序。美国正在由转化型规制模式向技术型规制模式转变。《公平信用报告法》(Fair Credit Reporting Act)、《公平住房法》(Fair Housing Act)和《平等信贷机会法》(Equal Credit Opportunity Act),这些立法不区分算法或人工决策,但要求决策的结果符合法律规定。③参见陆凯:《美国算法治理政策与实施进路》,载《环球法律评论》2020年第3期。这些立法属于典型的转化型规制模式,这种模式对立法技术要求不高,但是容易造成监管的“空心化”。在风险社会,监管的滞后容易造成严重的后果。基于此,美国目前将算法规制的节点提前至技术阶段。2019年美国《算法责任法案》草案,该法案要求特定商业实体对涉及个人信息或做出自动化决策的高风险系统进行详细评估,例如使用人工智能或机器学习的系统。2019年美国《司法算法正义法》(Justice in Forensic Algorithms Act)正在辩论程序中。该法案规定了美国国家标准与技术研究所(National Institute of Standards and Technology,NIST)应当建立司法算法软件的测试标准,执法机构只被允许使用符合NIST标准的软件。除此之外,该法案规定被告人有权获得司法算法软件的源代码、软件的早期版本、对软件结果必要的说明以及用于训练和测试数据,法官不得以商业秘密为由拒绝被告人的申请。用于处理证据的算法必须经过NIST测试之后才可以使用。除了联邦层面的立法外,纽约州和新泽西州也从技术规制的角度出台了算法责任法案。

纵观目前对算法规制措施的讨论不难发现,绝大多数学者对算法的规制,都着力于算法本身所具有的技术性特征,疏于在特定场景下对规制措施与传统法律规制模式的关系考量。在证据法场域中,探讨法官对算法的审查,必定走入认识论的死胡同,从而给人们一种就算法论算法,脱离实际的印象。而转化型问题的背后是对算法的另一种态度:避免陷入技术细节的纠缠,而从算法造成的结果进行防范。尽管这种转化型规制进路考量了法律人的认知局限,但是以结果防范为导向的规制路径有过于滞后之嫌。因此,我们需要探讨我国法官对证据中的科技是如何审查的,这是我们进行算法规制的实践前提。

(二)知识正当程序:法官对科技的认知模式

很多学者以理解算法的内部运行逻辑的角度出发提出规制措施。从具体的实现路径上,设定算法解释权利或算法解释义务。在证据场景中,从保护被告人的权利角度出发,这类建议固然没错。但是从法官事实认知模式的角度来说,我们在讨论科技产生的新证据时,不能对新的证据重新建构起法官的事实认识模式。因此,在讨论算法规制时,法官对算法如何认知,这是我们选择算法规制路径的现实制约。值得一提的是,在算法进入诉讼之前,科技在法庭上的典型表现形式是鉴定意见,笔者以鉴定意见为例探讨法官如何对科技进行认知。

在传统事实认知模式下,法官运用经验和逻辑,凭借感官对证据信息的察觉,对原生性证据所承载的信息进行逻辑推演。而随着科学技术涌入证据领域,科技所代表的技术理性替代了日渐式微的经验与逻辑,科学技术完成了对法庭是事实认知模式的“技术占领”。法官所独有的代表法律生命的经验,在科学技术面前无用武之地。法律专家不可能是面面俱到的每个领域的专家,这根本就是不可能的,也是做不到的;但他必须得是真正的法律专家才行,才能在法律的基础上甄别其他专家的同行意见,然后作出法律上的妥当决定。①参见陈景辉:《人工智能的法律挑战:应该从哪里开始?》,载《比较法研究》2018年第5期。于是,“法官是法庭的国王”这一传统共识也被打破,揭示科学技术所承载信息的技术专家成为与法官分庭抗礼的角色。法律将法庭上的技术专家定位于法官的助手,法官不受其意见约束。但事实上,根据福柯所主张的知识与权力的关系理论,任何不平等都会产生权力。正是由于法官与鉴定人专业知识的不对等决定了微观意义上权力的存在。鉴定人决定了科学知识对事实认定部分的话语权。在实践中也印证了这一点,一方面,鉴定专家不过是法官的辅助机关;一方面,法官不过是鉴定专家的一个无助的执行机关。②参见朱幅美:《科学鉴定与刑事侦查》,中国民主法制出版社2006年版,第34页。产生鉴定人与法官在事实认定权分配的原因是对鉴定人的定位,专家鉴定制度和专家证人制度是两大法系各自用来查明技术正义的不同方法。③参见王戬:《“专家”参与诉讼制度研究》,载《华东政法大学学报》2012年第5期。德国等大陆法系国家或地区将鉴定人定位为法官的助手,以弥补法官认知能力的不足。台湾学者也认为专家鉴定人是辅助法院判断特定证据问题之人。④参见赵立新,陈如超:《刑事法官与鉴定人事实认定的比较与整合》,载《湖北社会科学》2011年第6期。然而,这个程序是矛盾的。为什么法律体系一开始就允许专家进入到诉讼中?原因很简单,无论是法官还是陪审团都无法理解和解决专门性问题。但如果是这样的话,法官和陪审团作为外行决策者如何有能力再对专家的意见进行审查判断?在美国,这种实践困境被称为“专家悖论”。①See Edward K. Cheng, The Consensus Rule : A New Approach to Scientific Evidence, Vanderbilt Law Review, Forthcoming, Available at SSRN : https://ssrn.com/abstract=3826782 or http ://dx.doi.org/10.2139/ssrn.3826782.

可见,鉴定人与法官在事实上存在着事实认定的分工。而在英美法系国家,案件中的专门性问题的解决依靠控辩双方委托的专家证人,以对抗制的诉讼程序发现科学真相。英美法系的对抗制有效地避免了专家证人与法官分享事实认定权,但是这一制度的弊端是将庭审变为“鉴定大战”。因此,目前英国和美国在专家证人制度的改革中提出专家的首要义务是发现事实真相,并对法庭负责。

事实认定权力是立法者不断权衡下分配的结果。从我国与美国对专门性问题的法律规定可以窥见立法者的态度与倾向。大多数科学技术都具有自身的缺陷和风险,而法官需要审查的不是出现在法庭上的科技是否是完美的,而是如何评估一个不完美的研究。评估不完美的研究——也就是从不完美的知识中进行事实认定。②See Beecher-Monas Erica, Evaluating scientific evidence : an interdisciplinary framework for intellectual due process, Cambridge University Press, 2007,p.2.司法程序并不是一个无限追求实质真实的场域,如果法官真的通过掌握相应的科学知识审查鉴定意见,这会造成诉讼的无效率。法官只能依据法律的规定和心证将法庭上的科学证据视为完美的,防止诉讼过于拖延。美国最高法院通过Daubert案,确立了法官是科学技术的看门人,法官在科学证据可采性审查框架下独立做出决定。美国最高法院希望法官能够充分了解基础科学,以评估专家证词和基础科学研究的可靠性。此外,美国的法律体系也为陪审团提供了科学技术教育的途径。在美国庭审中,陪审团指示假定陪审员有能力做出独立决定,并特定告诫陪审团不要有专业知识顺从的心理。陪审员被告知“判断专家证词的方式与判断其他证人证词的方式是一样的”,且陪审团需要独自决定证人证词的分量。这也就是艾伦教授所提出的二分法,区分陪审团独立判断(教育模式)和专家知识优越(顺从模式)。

而与之相异的是,我国法律将技术问题寻找替代性测度机制。③《刑事诉讼法》司法解释第97条、第98条规定了对鉴定意见的审查:一是形式上审查鉴定意见是否符合相应的技术规范,《司法鉴定程序通则》第22条规定了鉴定的技术标准和技术规范采用的顺位。二是将鉴定意见的实质审查转化为法律程序问题,审查遵守程序规则的相关程序证据是否具备。《司法鉴定程序通则》第23条规定,鉴定人对鉴定过程进行实时记录并签名,记录可以采取笔记、录音、录像、拍照等方式。三是强制鉴定人提出可靠的鉴定意见。制定了《司法鉴定机构登记管理办法》、《公安机关鉴定机构登记管理办法》以及《司法鉴定人登记管理办法》等,鉴定意见的可靠性很大程度依赖陈词源——鉴定人的可靠性。全国人民代表大会常务委员会于2015年4月修改的《关于司法鉴定管理问题的决定》中规定了鉴定人的追责机制。由此观之,有关鉴定的方法、鉴定标准以及科学原理等问题已经纳入到了国家的鉴定管理体制之中,从而在审判程序之前很大程度上已经解决了鉴定意见科学性的评判标准问题。法官并不异于常人,不可能全知全能,科技证据的审查判断仍然需要依附于具体明确的司法解释或规范标准,将法官审查算法的压力传导给其他主体,法官只需要在法庭上做出形式审查即可。因此,我们需要将算法规制的节点提前,即设置算法进入诉讼前的规范标准,将规制算法的责任交给法律规范和技术标准,减轻法官对算法认知的困难。

(三)算法的规范归化:算法标准

法律与科技的关系是一个持久的话题,法律在应对单一功能的技术时,往往在事前设定技术和质量标准,并在事后通过落实侵权责任进行损害赔偿救济。①参见胡凌:《理解技术规制的一般模式:以脑机接口为例》,载《东方法学》2021年第4期。技术的标准并非在技术应用的初期设定,而是实践中经验和教训的总结,是技术细节凝练之后的产物。因此,技术标准的制定具有滞后性。实际上,技术标准正成为践行算法规制的重要场所。中央人民银行发布的《人工智能算法金融应用评价规范》就对金融场景下的算法设定了算法标准。②《人工智能算法金融应用评价规范》第6部分是安全性评价,其中包括对目标函数、算法可追溯性、算法内控等设定标准。第7部分是可解释性评价,从可解释性评价维度、建模准备、过程、应用全流程进行规范。第8、9部分是对人工智能的评价标准。在警企合作的大背景下,与各地公安机关合作的科技公司不同,这就造成公安机关使用的算法软件不尽相同。而使用的算法不同则会导致算法运行结果的混乱与失序,这与证据所具有的客观性、确定性相悖。对海量电子数据的算法技术显然应该具备统一性,否则相同的数据输入而输出的算法证据因区域区别却不同,将会冲击审判秩序。

在证据场景下,规范证据生成的技术标准早已有之。对电子数据调取、审查判断等问题,形成了以司法解释为依据,部门规章为细化规则,国家标准和公共行业标准为技术规则的完整规范体系。③司法解释:2012年《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》、2016年最高人民法院、最高人民检察院、公安部印发《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》。部门规章:2005年公安部就发布了《计算机犯罪现场勘验与电子证据检查规则》和《公安机关电子数据鉴定规则》,、2009年最高人民检察院颁布《电子证据鉴定程序规则(试行)》和《人民检察院电子证据勘验程序规则(试行)》、2010年最高人民法院、最高人民检察院、公安部、国家安全部、司法部联合发布的《关于办理死刑案件审查判断证据若干问题的规定》、2014年最高人民法院、最高人民检察院、公安部曾联合颁布了《关于办理网络犯罪案件适用刑事诉讼程序若干问题的意见》、2016年公安部制定了《公安机关执法细则》。此外,还制定了电子数据相关的国家标准、公共安全行业标准和司法鉴定技术规范。载https://mp.weixin.qq.com/s/5SXioNYMjOa8lS1CtS7cqA。对企业为司法机关提供技术支持的合法性,2018年最高院发布的《关于互联网法院审理案件若干问题的规定》第11条第2款规定了电子数据真实性认定的技术标准,即电子签名、可信时间戳、哈希值校验、区块链或电子取证存证平台认证。④《关于互联网法院审理案件若干问题的规定》第11条规定:“当事人对电子数据真实性提出异议的,互联网法院应当结合质证情况,审查判断电子数据生成、收集、存储、传输过程的真实性,并着重审查以下内容:(一)电子数据生成、收集、存储、传输所依赖的计算机系统等硬件、软件环境是否安全、可靠;(二)电子数据的生成主体和时间是否明确,表现内容是否清晰、客观、准确;(三)电子数据的存储、保管介质是否明确,保管方式和手段是否妥当;(四)电子数据提取和固定的主体、工具和方式是否可靠,提取过程是否可以重现;(五)电子数据的内容是否存在增加、删除、修改及不完整等情形;(六)电子数据是否可以通过特定形式得到验证。当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。当事人可以申请具有专门知识的人就电子数据技术问题提出意见。互联网法院可以根据当事人申请或者依职权,委托鉴定电子数据的真实性或者调取其他相关证据进行核对。在对证据分析的技术进行审查时,法官只需要对技术的外观进行形式审查,无需深入到技术内部,审查技术的运行逻辑。因此,对算法的规制,也应当建立司法算法的技术标准,使裁判聚焦于证据所承载的事实信息审查,摆脱外行人审查内行的困境。

我国2017年修订的《标准化法》将标准划分为四级包括国家标准、行业标准、地方标准和团体标准、企业标准。①《标准化法》第2条规定:“本法所称标准(含标准样品),是指农业、工业、服务业以及社会事业等领域需要统一的技术要求。标准包括国家标准、行业标准、地方标准和团体标准、企业标准。国家标准分为强制性标准、推荐性标准,行业标准、地方标准是推荐性标准。强制性标准必须执行。国家鼓励采用推荐性标准。”证据场景下,算法的科学性就体现在其标准化程度,标准化为法官审查算法证据提供了参照物,能够有效地缓和法官算法知识不足与算法证据审查之间的紧张关系,符合“将专业的事情交给专业的人做”的分工机制。将技术型规制转换为转化型规制路径,法官通过对算法的形式审查是否符合算法标准认定算法证据。如果算法的应用没有标准化,那么证据应用的算法准入门槛、算法的升级迭代会变成没有限制的无序发展。此外,司法算法的设计者是具有逐利性的企业,将司法算法标准化是算法技术外包的重要抓手。同时,司法算法标准化能够克减算法技术的资本色彩,提供技术支撑的企业所具有的私利性与司法所具有的公共性之间的矛盾得到消解。更重要的是,设定司法算法的标准能够对算法进行解释,可以防止法庭审判因过分纠结技术而拖延。算法解释源自对算法运行逻辑的不信任,算法技术所产生的黑箱更是对以公开透明为目标的社会运行形态的悖反。美国学者研究发现,人们对算法普遍具有一种“算法厌恶”(Algorithm Aversion)的心理。②对这种现象的一种解释是,人们错误地认为算法不太准确,尽管有证据表明它们更准确(“不准确的解释”)。Dietvorst等人证明了这种解释背后的机制:人们对算法的错误表现出比对人类更大的不容忍。如果人们看到一个算法出错,他们会认为这个算法是有缺陷的。当他们看到一个人类的错误,他们愿意再给它一次机会,相信他或她会学习。此外,Yeomans等人发现了一种不同的算法厌恶的驱动因素 : 人们对算法的不信任可能源于对它们如何工作缺乏理解。See Lowens Ethan, Accuracy Is Not Enough : The Task Mismatch Explanation Of Algorithm Aversion And Its Policy Implications, 34Harvard Journal of Law & Technology258, 261-263(2020).而构建算法信任,需要人们对算法的信任倾向和算法自身的可信度两个方面。③转引自袁康:《可信算法的法律规制》,载《东方法学》2021年第3期。建立司法算法标准是“毕其功于一役”的路径。当然,技术的应用一般都是“先兴起,再治理”,算法标准的制定也应当等待算法技术实践经验的沉淀。过于急切地在算法应用的早期制定算法标准,不仅不利于事实的认定,反而有限制证据领域算法的发展之弊端。

从算法标准的制定主体来看,算法的国家标准可以由公安部物证鉴定中心负责制定。④这也是该机构的主要职责。如电子数据的三个国家技术标准:GB/T29360-2012《电子物证数据恢复检验规程》、GB/T29361-2012《电子物证文件一致性检验规程》、GB/T29362-2012《电子物证数据搜索检验规程》都是由公安部物证鉴定中心制定。由于各地区公安机关合作的企业不同,算法的使用呈现地域性差异。因此,可以制定与细化国家标准的地方标准。从标准的内容来看,构建数据分析的算法模型分为三个步骤:犯罪行为特征提取、特征转换数学模型和数学模型代码化。可以发现,尽管算法标准解决的仅仅是第三个步骤的问题,但前两个步骤是决定算法模型可靠、合法的关键。因此,在标准制定前,应当组织由法学和计算机专业的专家、学者以及实务部门的工作人员组成的算法标准化委员会,承担算法模型构建的前两个步骤的标准化工作。目前,公安部经济犯罪侦查局就针对各种经济犯罪类案件在公安系统内部云系统上传了算法模型,但是尚未与检察院、法院共享。建立算法标准时可以对其进行借鉴。

结 语

以算法为主导的智能科技已经全面渗透到社会运行的各个领域之中,证据领域也不例外。法官事实认定的模式也发生了改变,从论证到建模、从经验到计算,数字与数据已经悄无声息地占领了裁判场域,重构了法官的认知模式。

将认识的经验建模,使算法模型替代人类自动化决策,算法已经融入社会运行体系的各个领域,成为每一个领域无法摆脱的影响性或支配性力量,我们每个人都成为算法运行系统中的人。可以预见的是,决策逻辑正由自动化决策向自主化决策迈进。届时,人的主体地位也受到威胁。康德的“人是目的而不是手段”这一论断在算法时代即将被重新定义。在自主性决策面前,人类就是被决策支配的工具。生活中外卖小哥被困在算法里这一现象,就是最具说服力的证据。在愈发紧张的人机关系中,对算法的规制呼声不绝。而回应呼声的解决之道在于建立算法标准。同样的,证据领域更需要建立算法标准来克减法官因审查算法而带来的压力。国务院在2017年发布的《新一代人工智能发展规划》中,制定了人工智能发展的战略目标,即到2025年,初步建立人工智能法律法规、伦理规范和政策体系,形成人工智能安全评估和管控能力。在规制算法时,法律需要汲取技术发展的积淀,降低算法规制对既有的体系和实践造成的风险。

猜你喜欢
规制法官证据
网约车平台责任条款的识别方法——基于解释进路的正当规制
控制股东滥用权利规制的司法观察及漏洞填补
法官如此裁判
法官如此裁判
完善地方政府行政作为法律规制的思考
手上的证据
家庭暴力证据搜集指南
手上的证据
内容规制
阅读理解两则