内容提要:司法鉴定的内涵、外延以及鉴定意见的生成机理,关乎鉴定规制及其证据审查,可谓鉴定知识体系的关键要素。步入数智时代,传统鉴定经数智化转型形成鉴定的新样态即数智鉴定,但数智鉴定的内涵与外延并不明确,因此亟待理论探析。明确上述关键要素的价值,不仅在于对数智鉴定形成理论性认识,还在于揭示数智鉴定的双刃剑效应。换言之,数智鉴定虽具备一定的效能优势,但也呈现出传统鉴定中不曾有过的可靠性风险以及侵权隐忧。
关键词:司法鉴定 生成机理 深度伪造 数智化转型 数智鉴定 特征比对
我们正处于以大数据为“食粮”、以算法为“大脑”的人工智能时代。
自我国于2017年通过《新一代人工智能发展规划》,将人工智能上升为国家战略起,司法领域便加快了数字智能化步伐。而服务于司法、为司法公正的实现提供重要证据的司法鉴定(亦可简称为“鉴定”),即在诉讼中鉴定人运用科学技术或者专门知识对诉讼涉及的专门性问题进行鉴别和判断并提供鉴定意见的活动,自然也不例外地被人工智能技术所青睐。随着算法的嵌入,早期的指纹自动识别系统(Automation Fingerprint Identification System, AFIS)【See Peter Komarinski, Automated fingerprint identification systems (AFIS), Amsterdam; Boston: Elsevier Academic, 2005, p.4.】得以升级优化,基因型概率(分型)软件(Probabilistic Genotype Software, PGS)【See U.S. Government Accountability Office Science, Technology Assessment, and Analytics,“Forensic Technology—Algorithms Used in Federal Law Enforcement”, May 12, 2020, https://www.gao.gov/assets/gao-20-479sp.pdf,p.3, last visited at August 26, 2024. 国内学者也称其为混合STR分型分析软件(Software for Interpretation of Mixed STR Profiles)。参见李甫、徐磊等:《两种混合STR分型分析软件的比较与应用》,载《刑事技术》2022年第1期。】、法医表型特征分子刻画技术、硅藻自动化识别及分类技术、人脸识别技术(Facial Recognition Technology,FRT)、虹膜识别技术等新技术或系统,更辅助鉴定人顺畅、快捷完成司法鉴定——无疑,因“数”有“法”进而“智慧”的“数智司法鉴定”已经更加客观、高效、高能。与此同时,大量算法与鉴定人共同参与生成的“数智鉴定意见”正步入法庭,成为诉讼中难以回避的话题——其生成机理及其可靠性隐患等审查判断细节,均关乎案件事实认定的准确性,影响当事人的人身权、财产权等权益。
从域外视角来看,以算法辅助专家证人生成证据的司法实践正在不断增加,而与司法鉴定密切关联的法庭科学界更出现了关于“自动法庭科技”(Automated forensic techniques)【See Edward J. Imwinkelried, Computer Source Code: A Source of the Growing Controversy over the Reliability of Automated Forensic Techniques, DePaul Law Review, Vol.2016(66), pp.97-98.】“法庭算法”(Forensic algorithms)【See U.S. Government Accountability Office Science, Technology Assessment, and Analytics , “Forensic Technology—Algorithms Used in Federal Law Enforcement”, May 12, 2020, https://www.gao.gov/assets/gao-20-479sp.pdf,p.3,last visited at August 26, 2024.】【See Brandon L. Garrett, Justice in Forensic Algorithms, Harvard Data Science Review, Vol.2020(2), pp.5-6.】等相关讨论;同时还有立法机构提出了《法庭算法正义法案(2021)》(Justice in Forensic Algorithms Act of 2021)等。目光回到国内则发现,既有学者提出了构建“大数据司法鉴定(平台)”【参见刘静:《风险与应对:论大数据司法鉴定的平台构建》,载《法学杂志》2021年第9期。】“智慧司法鉴定”【参见贾治辉、吴欣:《“智慧+”模式下司法鉴定发展路径探索》,载《中国司法鉴定》2019年第5期。】的设想,也有关于“大数据证据”【参见刘品新:《论大数据证据》,载《环球法律评论》2019年第1期。】“算法证据”【参见杨继文:《算法证据:作为证据的算法及其适用规则前瞻》,载《地方立法研究》2022年第3期。】“人工智能证据”【参见马国洋:《论刑事诉讼中人工智能证据的审查》,载《中国刑事法杂志》2021年第5期。】等新型证据的研究。诚然,这些研究直接或间接地涉及鉴定的数智化,【如:马明亮、王士博撰文谈及了大数据比对形成的鉴定意见的证明力问题,但论述篇幅相对较小。参见马明亮、王士博:《论大数据证据的证明力规则》,载《证据科学》2021年第6期;王燃:《大数据证明的机理及可靠性探究》,载《法学家》2022年第3期。】但鲜有聚焦鉴定过程本身,既未道明其与传统鉴定意见生成机理的不同及其价值,亦未全面展现数智司法鉴定带来的机遇及隐忧。事实上,唯有明晰鉴定意见的生成机理,抽象出鉴定的要素及结构,打破鉴定意见“客观真实”的迷信崇拜,方能有利于对其开展有效的审查判断。【参见李学军、朱梦妮:《物证鉴定意见的质证路径和方法研究》,中国人民大学出版社2015年版,第6页;李学军:《诉讼中专门性问题的解决之道——兼论我国鉴定制度和法定证据形式的完善》,载《政法论坛》2020年第6期。】因此,关注司法鉴定的核心环节,即从检材、样本的检验及其鉴定结果转化为鉴定意见的过程,极为重要。基于此,笔者拟以司法鉴定的核心环节为切入点,揭示司法鉴定数智化的规律,并廓清数智司法鉴定的含义和类型,进而分析数智司法鉴定带来的机遇与挑战。
一、司法鉴定核心环节的数智化转型
司法鉴定的核心环节即鉴定意见的生成过程。随着数智技术介入司法鉴定,鉴定意见的生成机理正在迭代。从鉴定人的认知决策地位来看,司法鉴定核心环节的数智化,意味着数智技术正部分发挥着鉴定人原有的权能,而鉴定人在鉴定中的专属地位则相对下降。明晰该机理转变,无疑有助于准确把握数智司法鉴定的概念由来及其优劣。
(一)以特征比对法鉴定为代表
鉴定涉及众多环节,如鉴定的委托、受理、鉴定的展开及鉴定意见的生成等,同时还涉及不同的鉴定方法。无疑,鉴定的展开及鉴定意见的生成是鉴定的核心环节,而所用的鉴定方法终归可概括性地分为比对鉴定法和非比对鉴定法。因此,本文将聚焦于鉴定展开及鉴定意见生成这一核心环节的机理进行探析,并结合鉴定展开或具体施行时最常见、最广泛使用的鉴定方法即比对法,来研究鉴定的数智化转型。诚然,我国现有法律规定及相关法规、规章等已明确,当下的司法鉴定包括法医类鉴定、物证类鉴定、声像资料鉴定和环境损害鉴定这四大类鉴定,以及该四大类以外的司法会计鉴定、知识产权鉴定这些鉴定类型;但从如上概括性的鉴定方法来分类,也可将当下的司法鉴定分为比对型鉴定以及非比对型鉴定。
所谓比对型鉴定,即以被鉴定客体的相关特征为重心,通过比较检材(需断定真伪或出处的客体)特征与样本(供鉴定真伪或出处的客体)特征之异同,即比较法(Feature-comparison methods)而具体施行的鉴定——诉讼中最常出现的鉴定需求即种属认定与同一认定型鉴定便是此类比对型鉴定。而该比对型鉴定,表述为“特征比对型鉴定”更为明晰,因为,“特征比对”系此类鉴定中必不可少的判断依据及鉴定手法:一方面,种属认定、同一认定型鉴定时,均涉及分别检验、比较检验和综合评断这三个环节,而“特征”的“比较”正是其中的关键方法;另一方面,在域外,特征比对法已被法庭科学界格外重视。例如,美国的总统科技顾问委员会(Presidents Council of Advisors on Science and Technology,PCAST)曾于2016年发布关于保障法庭科学证据有效性(The validity of forensic evidence)的报告,其即以“特征比对法”为基础的鉴定为核心,来作为刑事司法中法庭科学技术的代表。【See Executive Office of the President Presidents Council of Advisors on Science and Technology, “Report to the President Forensic Science in Criminal Courts: Ensuring Scientific Validity of Feature-Comparison Methods”, September 20, 2016, https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/PCAST/pcast_forensic_science_report_final.pdf,p.1,last visited at August 26, 2024.】更重要的是,特征比对型鉴定是鉴定实务中常见的一种鉴定,因而可作为鉴定的典型代表。指印鉴定、DNA分型、笔迹鉴定、工具痕迹鉴定、足迹鉴定等鉴定,便是特征比对型鉴定的具体体现,并很大程度上受当下大数据、人工智能、算法等科技的影响。基于此,本文以特征比对型鉴定为鉴定的代表,以其核心环节即鉴定意见的生成机理为视角,阐释其数智化转型的过程。
(二)传统鉴定意见的生成机理
在数智算法用于鉴定之前,鉴定人对于鉴定意见的生成有着专属地位:专家运用物理、化学、生物等专门知识和技术手段开展各种鉴定。例如,在手印鉴定中,技术专家可能会利用专用粉末、化学试剂或特定光源来找寻、标识送检指纹的潜在特征。在DNA分型中,专家可能会运用DNA提取技术、聚合酶链反应(PCR)技术和测序技术等手段,获得鉴定对象(检材、样本)的DNA图谱。在人脸比对鉴定中,技术专家可能会使用摄影技术、图像处理技术来提取和强化人脸图像的特征。
这些示例中用于手印鉴定、DNA鉴定和人脸比对等鉴定的技术手段,尽管在技术原理上千差万别,获得的鉴定结果在形式上也表现不一,但其发挥的作用相似——即展现出了鉴定对象的特征——在此基础上,鉴定人再从这些经强化的图像、音视频、数据或图谱等鉴定结果中筛选出具有鉴定价值的特征,进而作出鉴定意见。【关于鉴定结果和鉴定意见的关系的论述,参见李学军:《诉讼中专门性问题的解决之道——兼论我国鉴定制度和法定证据形式的完善》,载《政法论坛》2020年第6期。】换言之,此等鉴定意见的生成过程中,人与技术存在认知与决策的分工,且技术手段本身并没有参与特征选择以及特征比对分析等鉴定的核心检验环节——即鉴定人,居于技术手段之上实为鉴定检验决策的主角。因此,传统鉴定意见的生成机理实质上表现为“鉴定人全局主导”的结构。
(三)鉴定意见生成机理的数智化
上述既有的鉴定意见生成机理,较好地抽象出传统鉴定的要素和结构。但是,随着数智技术深度融入司法鉴定,该生成机理的适用性受到挑战。一是难以解释越来越多鉴定中出现的算法要素。即算法不仅用于呈现被检验的指印、笔迹、DNA等所含客体特征,还用于自动识别、比对客体特征,显然,既有的传统鉴定生成机理无法反映这些现象。二是难以体现人与算法的交互情况,进而无法提示数智司法鉴定隐藏的可靠性风险、无法为所形成的鉴定意见提供审查判断的分析框架。因此,有必要顺应数智技术潮流并更新数智鉴定意见的生成机理。
数智鉴定与传统鉴定的最大区别在于算法介入了检验(阶段),这导致鉴定人的专属地位受到冲击。在鉴定时,识别特征并对特征进行比较检验,通常被认为是鉴定人的能力专权。但是,当算法介入司法鉴定时,这种传统鉴定模式将被打破:数智算法技术不仅发挥辅助鉴定人的作用,而且实质性参与检验的决策——其具体体现在以下三方面。
1.特征识别自动化
自动化是运用技术、程序、机器人技术或流程来“代替人的体力或脑力劳动”【参见李绍炎:《自动机与自动线》,清华大学出版社2020年版,第1页。】;自动识别特征,便是运用算法等技术手段,在人力投入最小的情况下实现特征识别。一方面,算法可自动识别人类可感知特征,即对于图像、声音等可通过人的感官识别的特征,算法能自动识别。另一方面,算法亦可自动识别人类难以直接感知的特征。鉴定时,图像(如笔迹的字形、字体以及运笔、连笔特征等)、语音(说话人的音高、嗓音、节奏信息等)等信息能被人的眼睛、耳朵等感官直接捕获,并用于比对分析进而得出可靠的鉴定意见。但是,人的感官捕获的信息有限,如笔迹中潜藏的书写速度、压力和时序等动态特征,语音中蕴含的共振峰、音强、基频率信息等,难以被人眼或人耳所直接感知。随着数智技术的嵌入,上述原本无法或难以“肤浅”反映在客体上的特征,可被算法驱动的传感器(如同人的“机器感官”)所识别并记录,进而具备可用性。例如,搭载有动态签名识别算法的电子化签名系统,不仅能记录笔迹的静态图像信息,还能通过电子屏板准确捕捉笔迹形成的动态特征。而说话人自动识别系统则能识别上述人耳难以识别的声学特征参量。这无疑扩大了可用于比对、分析的特征疆域。
2.比对分析自动化
被算法提取或识别的特征,将被用于自动比对或分析。换言之,算法已经介入鉴定的比对/分析这一重要环节。自动比对,是指匹配算法(Matchers)将检材特征与数据库中存档的样本特征进行自动化比对,筛选出数据库中最为相似的一系列待检样本,并将其按照相似性高低顺序进行排列(这个待筛选列表可以看成“机器意见”)。在数智算法的参与下,重复枯燥的比对负担从专家肩上卸下,鉴定效率大幅提升。
算法不仅可用于自动比对,还能用于自动分析其他专门问题。与自动比对类似,自动分析便是模拟人分析问题的流程,以实现在人的最少参与下得出分析“意见”。用算法进行自动分析的重要性日益提升,以混合DNA分型为例便可证实这一点。混合DNA分型,是指对来自两人或更多人的DNA混合物进行分析以确认其各自身份。其与传统DNA分型的主要差别不在于分离提取技术,而在于DNA图谱的解读难度。对于传统DNA分型,人工解读图谱并计算出检测对象的基因型被证明是可靠的。若使用数智方式分析,则能提升解读效率。然而,对于混合DNA图谱分析,人类专家面临一系列分析难题:混合DNA由多少人组成;各组分DNA的比例是多少;各自的基因型是什么;等等。【参见彭柱、徐珍等:《混合STR分型分析方法研究进展》,载《刑事技术》2022年第1期。】对于简单的混合DNA(两组分混合DNA并满足特定条件)【我国现有行业标准中关于混合STR分型解释的内容较少,仅限于两组分混合下,存在已知对照样本拆分另一未知个体分型,或者两个样本混合比例大于10∶1且均为杂合子时的无对照拆分。参见中华人民共和国公安部:《人类DNA荧光标记STR分型结果分析及应用》,GA/T 1163-2014。】,这些问题一般也可由专家解析DNA图谱后解答。但若混合DNA的组分变得复杂(例如,涉及三人的DNA混合斑),混合DNA图谱的解读难度便陡增【这是因为混合STR图谱受多种因素的干扰,如影子峰、插入峰、峰丢失、峰饱和、等位基因共享、杂合不平衡、降解等。这些因素的叠加,就使得混合STR图谱十分复杂。参见季现超等:《SMART:自主研发的混合STR图谱分析系统》,载《刑事技术》2022年第1期。】——此时,人工分析不仅耗时费力,而且专家之间的意见也可能具有显著差异。基于此,实务鉴定专家通常拒绝就此混合DNA进行分析检验并出具分析报告,或不得不借力于基因型概率(分析)软件(PGS),自动分析混合DNA图谱并给出“鉴定结果”即“机器意见”。
需要说明的是,不论是自动比对,抑或自动分析,并不意味着此环节没有鉴定人等专家的参与。算法的可靠应用,离不开鉴定人等专家事先设定算法相关参数或假设,确认输入的检材数据适用于特定算法。【参见彭柱、徐珍等:《混合STR分型分析方法研究进展》,载《刑事技术》2022年第1期。】因而从本质上说,算法自动比对分析后得出的“鉴定结果”,是一种“算法分析与人类知识交互的意见性结论”。【参见黄健:《刑事司法证明中大数据相关关系的局限作用论》,载《清华法学》2023年第2期。】
3.鉴定人核验
对于上述算法功能,即自动识别特征并自动比对分析,可统称为自动化决策。【我国《个人信息保护法》将“自动化决策”定义为“通过计算机程序自动分析、评估……并进行决策的活动”。可见,自动化决策的核心要素是计算机程序(而非人)进行决策。】需要注意的是,尽管自动化决策可给出诸如认定同一等“鉴定结果”,但该鉴定结果并不意味着认定同一的“鉴定意见”。【因而,大数据比对分析形成的“鉴定意见”,在笔者看来,表述为“鉴定结果”为宜。参见马明亮、王士博:《论大数据证据的证明力规则》,载《证据科学》2021年第6期。】通常而言,算法会根据输入的检材数据,按照检材与样本相似程度高低或其他标准,返回一个(可疑人员)“候选名单”(Candidate list),鉴定人再依据传统比较检验方法,认定检材与样本是否源于同一人。【例如,指纹自动识别系统(AFIS)的工作原理便是如此,算法会从指纹数据库中检索出与检材指印最为相似的多个指印,以便鉴定人员进一步比对检材与样本是否同一,并给出鉴定意见。参见[美]查尔斯·R.斯旺森等:《刑事犯罪侦查》,但彦铮、刘静坤、杨立云等译,中国检察出版社2007年版,第320页。】而对于超出鉴定人认知能力范围的鉴定(如复杂的混合DNA分型,或“少笔画签名”的真伪鉴定),算法似乎“主宰”了鉴定意见的生成,鉴定人核验“机器意见”也似乎不具有可行性。其实,即便如此,鉴定人也有发挥核验作用的空间:在算法运行前,需要鉴定人设置相关参数或作出特定假设,并确保个案检材适用于算法的可靠性范围;在算法运行后,鉴定人也有必要验证算法是否正常运行,才能出具相关的鉴定意见。
简言之,由于算法技术的介入,数智司法鉴定意见的生成机理已不再是“鉴定人全局主导”结构,而与传统鉴定相比具有显著区别。数智鉴定意见的生成机理可概括为“自动化决策+鉴定人核验”。
二、数智司法鉴定的内涵与外延
数智鉴定是数智时代鉴定知识体系的新概念,前文已论及该概念的由来是鉴定实践的数智化转型。而明确一个概念的关键,从形式逻辑视角看,在于阐明其内涵与外延,这是对其进行理性认识的必经之路。
(一)数智司法鉴定的内涵
以大数据为“食粮”、以算法为“大脑”的人工智能介入司法鉴定后,不但变更了传统鉴定意见的生成机理,也进而影响到新型鉴定意见即“数智鉴定意见”【我国已有学者创设出“智慧鉴定”这一术语,但其涉及“鉴定委托、材料补充智慧化、鉴定管理智慧化、鉴定实施过程智慧化和鉴定质证智慧化”多个环节。本文选用“数智司法鉴定”一词来表述,则是强调“算法与鉴定人合作完成的司法鉴定核心环节”——当然,读者也可以将本文的数智鉴定理解为狭义的智慧鉴定或智慧鉴定的重要组成部分。】在诉讼应用中的审查判断,因此,有必要就前文反复使用的“数智司法鉴定”一词予以界定并就其特性展开探析。所谓数智司法鉴定,即鉴定人为了解决诉讼中的专门性问题,借助以数据为本、以算法为要的人工智能技术对相关鉴定对象展开检验、分析判断,并给出鉴定意见的专门性活动。无疑,“数”的强调、“智”的凸显,更有助于大家重视并在意人工智能对司法鉴定核心环节的深刻影响,以及对其所形成的数智鉴定意见展开审查判断时应注意的核心问题。
明确数智鉴定内涵的关键,在于阐释其特性。数智司法鉴定作为传统鉴定的迭代升级,自然承继着传统鉴定的基本属性,即大家通常认同的法定性、中立性、专门知识性和主观意志性等。【“意见性”是相对于鉴定意见或专家证据这种证据而言,而本文所述“主观意志性”是关于鉴定活动的性质。参见李学军:《诉讼中专门性问题的解决之道——兼论我国鉴定制度和法定证据形式的完善》,载《政法论坛》2020年第6期。杜志淳主编:《司法鉴定概论》,法律出版社2018年版,第7页以下。】不仅如此,笔者在其他文章中已论证,数智鉴定的核心环节还存在人与技术之间的“耦合性”(简称人技耦合性)——该特性的探究,对鉴定意见可靠性风险的揭示与审查具有指导作用。简言之,人技耦合性的提出是为了反驳或警惕“人机协同”这种侧重于“技术助人”的单方面认识。因为,人与算法技术不仅有单向、正面影响的关系,还有技术对人的负面影响。例如,鉴定人可能轻信人工智能系统的判断导致错鉴,即后文将阐述的“自动化偏差”。换言之,在数智鉴定中,人与人工智能技术并不能以“人机协同”这种单向表述来概括,其实际存在一种双向互动关系,即耦合关系。因此,采用人技耦合性这种中立的表达表征数智鉴定的特性和内涵,更为全面并契合实际。
(二)数智司法鉴定的外延
前文已明确数智鉴定的内涵,进而需阐明其外延,即具有哪些具体类型?除了鉴定的法定类型外,从传统观点来看,有学者以鉴定学学科为分类标准,将鉴定分为法医学鉴定、物证技术学鉴定、司法会计学鉴定、环境损害鉴定、声像资料鉴定等。此外,也可按鉴定客体、鉴定程序等对鉴定予以分类。【参见杜志淳主编:《司法鉴定概论》,法律出版社2018年版,第62页以下。】上述传统分类共同构成了司法鉴定学的分类理论,这对于认识鉴定的外延,且对鉴定活动的具体展开无疑具有重要指导价值。
进入数智时代,作为关键变量的人工智能步入鉴定活动核心环节,乃人类历史上首次深度介入和承担人类认知功能的技术,其无疑为鉴定新类型的创设带来坚实的技术根基。但是,上述既有分类理论并未反映人工智能技术如何影响鉴定人行为或何以挑战传统鉴定范式。因此,以人工智能作为划分标准进而丰富鉴定的外延理论尤为必要。本文认为,可以人工智能介入鉴定的方式为标准,将数智鉴定分为“以人工智能为方法的鉴定”与“以人工智能产物为对象的鉴定”。
第一,人工智能介入鉴定人一方的工作,构成以人工智能为方法的鉴定。前文已述,人工智能介入特征比对型鉴定,形成了“自动化特征识别—特征比对—鉴定人核验”的鉴定模式。AFIS耦合下的指印鉴定、人脸识别系统耦合下的人像鉴定、PGS耦合下的混合DNA分型等,均为此类鉴定。有别于传统鉴定,此类鉴定在鉴定实施的效能方面显著提升,本文第三部分将就此展开进一步的论述。
第二,人工智能介入鉴定对象的形成,则构成以人工智能产物为对象的鉴定。目前,此类鉴定有待规范化。近年来,人工智能中的深度学习技术被用于合成文本、图片、音频和视频等电子数据,构成了坊间广为流传的“深度伪造”(DeepFake)之举。这种由生成对抗网络(Generative Adversarial Network,GAN)算法生成的电子材料具有“超拟真、反鉴别、快更迭”的功能特点,【参见吴进娥、冯树春:《“深度伪造”技术对法官认知的冲击及应对》,载《学习与探索》2023年第9期。】导致实践中出现了“换脸”“仿声”的新型电信网络诈骗。【参见邬林桦:《换熟脸视频+合成熟人声音,“AI诈骗”如何应对》,载《解放日报》2023年5月26日,第5版。】“深度伪造”不仅为新型犯罪治理带来挑战,也冲击着传统鉴定范式。详言之,“深度伪造”的出现,颠覆了实践中“眼见为实”的经验法则,冲击着传统鉴定中以感官为判断依据的范式。也就是说,对于“深度伪造”形成的视听资料,传统的特征识别方式,如眼观、耳听,极有可能被“深度伪造”特征所误导。因此,以人工智能产物为对象的鉴定,实际上也不得不借助智能识别算法的力量。对此,技术界已逐步推出相应的检测手段。【参见王怡、杨洪臣:《一种AI换脸方法生成的伪造视频分析》,载《刑事技术》2021年第1期。】
值得注意的是,虽然“深度伪造”已有检测技术应对,但理应与之配套的鉴定、审查规范却尚未跟进。截至目前,我国国家标准、行业标准、团体标准均未对此进行专门规制,【笔者在中国知网“标准”栏目,以“深度合成”“深度伪造”为关键词进行全文检索,均未检索到相关标准。】如何规范化开展“深度伪造”产物的鉴定,尚需进一步的学理探讨与实践摸索。尽管如此,从学理上提出以人工智能产物为对象的鉴定仍然有其价值,该分类有助于提示事实认定者留意“看起来真”的证据实际上存在被“深度伪造”的风险。因此,具体案件若涉及“深度伪造”的图像或音视频时,应进行专门性检验或鉴定,而非依赖于传统的感官判别。
综上所述,随着算法参与检验分析环节,司法鉴定实现了数智化转型,促生了数智鉴定的内涵与外延。一方面,鉴定意见的生成已具有人技耦合性,可称作数智司法鉴定;另一方面,鉴定中人工智能的介入创新了司法鉴定的类型理论。这为深入认识数智鉴定的“双刃剑”效应提供了本体基础。
三、数智司法鉴定的优势与隐忧
(一)数智司法鉴定的优势
司法鉴定的数智化是大势所趋,相对于传统司法鉴定而言具备一系列优势。
一是提升司法鉴定效率。在传统鉴定中,手动比对指印、比对人脸图像或计算DNA分型概率可能耗时数千小时未果,而借力于AFIS、FRT、PGS等数智技术耦合鉴定,可在当天甚至数分钟内便完成比对或分析。数智赋能后的鉴定效率提升可见一斑,对此不赘。
二是赋能司法鉴定意见一定的客观可靠性。除前文所述提高鉴定的效率外,鉴定的数智化还提高了鉴定意见的客观可靠性。鉴定是客观的原理、技术与鉴定人的主观能动判断的统一。鉴定人在鉴定中的干预越少,鉴定意见越趋向客观可靠。鉴定的数智化恰恰是比较法的客观可靠化——让机器和算法从事重复性的特征选择与比对分析,能在一定程度上降低鉴定人员的失误、偏见以及徇私带来的主观偏差,为司法鉴定意见的可靠性提供了一层保障。与此同时,方法趋于客观会提高“同案同鉴”【这里用“同案同鉴”旨在表明,同一鉴定主体运用算法协助鉴定后,当面对类似鉴定案例时,能缩小前后多次鉴定意见的差异。同理,不同鉴定机构等主体在运用算法协助鉴定后,机构间的鉴定意见差异也会缩小。】的可能性,进而有利于提高鉴定意见的可信度及鉴定机构的公信力。
三是数智司法鉴定有助于提高鉴定意见的可靠性。以人脸识别为例,工信部曾发布《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,支持生物识别等技术在安防、金融等重点领域的应用,并计划在2020年实现复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%。相较于传统人工比对人脸图像而言,人工智能算法的准确性可谓达到“机智过人”的程度。在此类高性能人工智能耦合下,鉴定意见的可靠性也会随之提升。
四是数智司法鉴定还具有一定的超越性,即鉴定的边界因数据和算法的介入而得以拓展。例如,机器和算法的介入让“少笔画”(电子化)笔迹的鉴定成为可能。具体而言,对于“少笔画”的伪装签名(如鉴定“丁一”二字是否由本人书写),在传统笔墨环境下,鉴定人难以甚至无法完成此种鉴定,因为传统条件下的笔画缺失,会导致笔迹特征反映不够充分,进而不具备鉴定条件。但在无纸化条件下进行电子化签名时,电子设备将记录书写人运笔的时序、压力、速度等特征,鉴定人若能从计算机中调取这些“原始数据”,使用“传统笔迹鉴定+电子数据分析”相结合的方法,便有了鉴别“少笔画”签名是否由本人书写的现实基础。又如前文所述,对于混合DNA鉴定,在PGS介入后,三人混合的DNA乃至更为复杂的混合DNA,均能在对应智能分析软件的助力下发挥超越传统鉴定的证明效力。
(二)数智司法鉴定的隐忧
尽管司法鉴定的数智化具有上述效能优势,但是,更值得注意的是,司法鉴定的数智化也会引发一系列隐患或挑战,有待学界和实务界进一步规制或应对。
一是自动化偏差的存续。自动化偏差,是人们倾向于信任数智系统给出的结果而忽视与之冲突信息的认知偏差。这种偏差具有极强的迷惑性,即便是经验丰富且受过专门训练的专家也难逃此种偏差影响。其实,自动化偏差在数智技术普遍渗入司法鉴定前便被察觉,如发生于2004年的“马德里炸弹恐怖袭击案”中涉及一起典型的指印错鉴。该案中,涉案指印先后经美国4位专家(含一名法官委任的专家)鉴定,他们均在AFIS给出的“机器意见”基础上错将嫌疑人认定为布兰登·梅菲尔德(Brandon Mayfield)。之所以在数智时代再次强调自动化偏差,是因为自动化偏差不会随着数智技术的更新而消失,反而会因人工智能技术的迭代而更具隐蔽性。因此,数智鉴定若要可靠落地,需学界对此足够重视,并在将来对数智技术在鉴定中的前端设计、中端应用以及后端审查上,予以技术和规范层面的系统性规制。
二是证据新样态的审查挑战。相对于传统鉴定意见而言,数智鉴定意见的生成机理增加了算法因素而变得相对复杂。从算法层面看,如何审查数智司法鉴定中所用算法的可靠性、如何破解算法黑箱是传统鉴定不曾有过的问题;从鉴定人层面看,鉴定人面对的自动化偏差应如何避免或减轻、鉴定时与算法的交互操作应如何规范化并透明化更是应该重视的方向。因此,数智鉴定的出现同时带来了证据新样态的审查问题,这将是证据学界与司法实务人员不得不面对的重要问题。
三是隐私和个人信息保护问题。DNA、指纹数据、声纹数据等生物识别数据属于我国《个人信息保护法》规定的敏感个人信息,其关乎个人隐私、信息保护以及财产安全。对于将生物识别数据用于鉴定,我国相关法律法规有待明确细则。例如,2012年修订的《刑事诉讼法》第130条(现为第132条)授权侦查机关提取生物样本。据此,指纹信息无疑可被收集到大数据库中用于鉴定。但声纹、人脸图像、DNA信息等能否被依法收集并用于鉴定,目前未有明确规定。对于生物识别数据的安全存储和及时删除问题,我国已有部分国家标准予以规制,【例如,《个人信息安全技术—个人信息安全规范》(GB/T 35273-2020)、《信息安全技术—远程人脸识别系统技术要求》(GB/T 38671-2020)、《法庭科学DNA数据库建设规范》(GB/T 21679-2008)等。】但此等规制也存在法律效力低和法律衔接问题,有待学界进一步回应。
Abstract:The connotation, scope, and generative mechanisms of forensic appraisal opinions, which are critical to regulation of forensic appraisals and evaluation of such opinions, are essential elements of forensic knowledge system. In the digital and intelligent era, traditional forensic appraisals have evolved into a new, more advanced digital and intelligent form. However, the precise definition and scope of this new form of appraisal remain unclear, necessitating a theoretical exploration. Clarifying these key elements is crucial not only for developing a theoretical framework for digital and intelligent forensic appraisals, but also for revealing its double-sword impact. In other words, digital and intelligent forensic appraisals may prevail in validity and efficiency, nonetheless, it also faces reliability risks and infringement concerns, compared to traditional forensic appraisal methods.
[责任编辑 邢峻彬]