高 波
当前的诉讼制度改革是以审判为中心展开的,司法实践中证据分析的精细化对证据分析提出了更高的要求,收集并挖掘电子数据的深层含义,已经成为电子数据应用于诉讼活动中的重要途径。这迫使人们对电子数据的认识活动提高到一个新的水平,对如何从海量电子数据中去挖掘并分析那一丝与诉讼相关联的电子数据证据提出了挑战。虽然探讨计算法律(computational law)、算法裁判以及人工智能代替法官直接作出裁判为时尚早,但科学地运用人工智能的规则与推理手段、建构电子数据证据分析框架模型,却可以从海量的电子数据中获取隐藏于其中的证据信息并发现其中的模式和内在关系,人工智能电子数据的证据分析已成为辅助司法的重要手段。
20世纪60 年代,人工智能便开始进入司法证明领域,但由于当时的人工智能大多是建立在确定性或者精确性基础之上的机器智能,不断暴露出因为其公理系统的强形式化,即所谓的严格、精确而带来的诸多局限。而在图灵机器运算发展到互联网云端计算后,人工智能也从确定性数学和符号逻辑来模拟人脑思维活动进入到模拟人类认知过程的不确定性人工智能新时代,即从人类认知的不确定性出发,对不确定性知识的表示、处理,寻找并形象化地展现,发现不确定性知识的规律性,利用机器、系统或网络模拟人类认识客观世界和人类自身的认识过程,使其具有智能。但不确定性人工智能获取与分析的电子数据构成的“可能证据”会对证据法中的“可采证据”产生巨大影响,因此,此类电子数据证据的来源可信性问题,以及从数据到概念、从概念到知识的定性定量转换和连接信息点的发现、直至数据信息由细粒度到粗粒度的逐步归纳简约的证据分析过程,是基于不确定性人工智能电子数据证据研究的重要问题。
知识的表示问题成为不确定性人工智能中的重要问题,司法人工智能就是以知识为中心的。边沁在《引论性观点》中指出:“证据领域不过是知识领域”,事实认定者需要全面认识证据。但是,即使认识了大量的证据还不等于认识了事实,从主体知识认识的角度看,事实作为一种真实存在,总是以某种判断的形式被人们所把握;从知识表达的角度看,人们之间相互传递关于事实的知识是通过“语言”来实现的;从知识理解的角度看,人们能够学习知识是因为命题与事实之间具有同构性。认识主体必须通过推论性思维,通达人脑对客观事物本质属性和内在联系的反映和认知,才能对大量的证据及其相互之间的关系进行科学的分析和判断,由表及里,去伪存真,才能准确认定待证事实。
人类在认知过程不可避免地伴随有不确定性,知识的获取也凸显出不确定性,在量子力学研究粒子构成的微观世界里,原子或者粒子构成的群体的运动既具有波动性,又具有粒子性,据此德国物理学家沃纳·海森伯格(Werner Heisenberg)提出了“测不准原理”,这表现在电子数据信息获取过程中,就是电子数据信息具有随机性、模糊性、不完备性等不确定性属性。而认识过程的不确定性体现在感觉的不确定性、知识结构的不确定性、记忆的不确定性、思维的不确定性。认知的不确定性决定了不确定性人工智能需要定性定量双向转换的认知模型,运用不确定性知识发现的物理学方法,在电子数据云计算、自然语言理解、图像识别、数据挖掘领域可以发挥巨大作用。
不确定性人工智能是用概率对随机性信息进行量化,借助随机变量的分布函数来获取随机电子数据信息。而“在法律争议中,不存在能以绝对确定性来阐述的结论。所以,概率概念在法律语境推论中的使用,与其他语境中的使用同样普遍”。从证据法的视角来看,基于不确定性人工智能技术,电子数据证据的获取随着信息技术应用的普及,呈现多样性和多元化趋势,可以在不同粗细的概念粒度上进行深度学习,具体来说集中于知识工程的信息点挖掘、模式识别以及证据标准的表达方式这三个方面。
首先,基于不确定性人工智能的电子数据连接信息点的挖掘与分析。在法律实践中,事实调查是一项重要和困难的任务,在事实调查中需要分析出电子数据必要成分的生成要素。这些成分涉及电子数据证据论证中的假设或命题、各种电子数据证据及其连接假设。因此,事实调查涉及电子数据证据的分析和收集,这需要有足够的信息来预报该事实,需要强大的整理和分析这些信息的能力。而大数据时代很难靠自然人力去发现电子数据的“连接信息点”(connect the dots),或者无法从大量电子数据中鉴别出某些有意义的琐事,不确定性人工智能为诸如相关性规则等证据规则的分析提供了方法。
其次,运用不确定性人工智能技术对获取电子数据的识别模式。基于不确定性人工智能识别是技术层问题,包括计算机视觉识别、生物识别、语言文字识别、自然语言处理等,而这些技术的实现离不开大数据、计算力和算法等基础支持层,其中不确定性人工智能的模糊聚类、贝叶斯网络等算法对电子数据的特征提取、分类、聚类和模式匹配,使得电子数据的识别技术成为保障经济和社会安全的重要工具。例如,在公安、海关,甚至诸多服务性系统中得到普遍应用的人脸识别正是不确定性人工智能领域商业化应用较为成熟的业务。相比其他识别方式,人脸识别具有非强制性、非接触性、并发性、人工审核容易等特点,其成为人工智能获取电子数据证据的重要方式。
再次,一般来说,电子数据总是不完全的(always incomplete),事实判断者不可能掌握所有电子数据,获取的电子数据常常是含糊的(ambiguous),事实判断者不能完全理解电子数据传达了什么信息。这影响着电子数据证明力的评估方式,最终会影响法庭推理认证的结果,这种推理风险是司法证明过程的伴生风险。各类证据据以证明待证事实的过程都存在不同程度、不同类型的推理风险。鉴于电子数据信息的更具隐蔽性、易变性,导致在分析证明领域中的电子数据推理风险显得更加突出。有效识别电子数据的推理风险,需要强化对电子数据证明过程的解析,构建独立的证据认定体系。可以运用不确定性人工智能技术,结合先验概率和后验概率,将复杂的联合概率密度分解成一系列相对简单的模块,降低了电子数据信息发现和概率复杂程度,这使得不确定性人工智能在电子数据信息表达和推理方面更具有科学性和严密性,因为不确定性人工智能的表现形式是网状思维结构和概率分析,基础数据是先验知识和样本数据。
经法庭审查具有证据能力的诉讼证据,如果在庭审证据调查程序进行质证后,仍存在无法解释的矛盾,或者无法与其他证据相互印证,就将因欠缺证明力而不能作为定案的根据。电子数据存在失真风险,这直接关系到电子数据的证明力。传统上有关证据证明力的判断,主要是以经验为基础,没有科学的规则和标准可供遵循。而电子数据证据审查判断方法的核心是对每一个电子数据链条的证明力都进行评估,并最终整合所有链条评估来决定与最终待证事实有关电子数据的净证明力(net probative value)。
电子数据证据可信性与电子数据的具体表现形式密切相关,而评价每一种证据形式的可信性时,必须考虑的属性是不同的,电子数据的可信性不止涉及一个维度或属性。在不确定性人工智能视域中,当有海量电子数据证据需要审查时,有两种电子数据证据形式在法律争端中是非常重要的——基于有形物的电子数据证据和基于语言(包括自然语言与人工语言)的电子数据证据。
基于有形物的电子数据证据有多种形式,包括数据化的物体、文件、传感图像、测量结果,以及诸如电子示意图、地图等各种表现形式。所有这些种类的有形物的电子数据证据都可以接受检查。在特定情况下,它们实际揭示的内容并不总是明显的。问题是,基于有形物的电子数据证据并不总是像它看起来那样,电子数据可以伪造,视频、图像可以错误标记,数据传感器可能存在故障等。在评价获取基于有形物的电子数据证据的可信性时,有三个重要属性必须加以考虑。
(1)真实性(authenticity)。真实性是基于有形物的电子数据证据具有可信性的最重要的因素。当事人必须提供“足以支持一项所主张事项之认定”的证据。而司法证明中所要求的电子数据具有客观真实性需要的是证据中的信息不以人的意志为转移的客观存在,充分体现了电子数据所承载的信息是证明的关键,但电子数据证据的一个重要特征是可再生性,这意味着如果除提出该主张的人之外其他任何人在同等条件下,通过使用基本相同或类似的仪器或程序,就会得到与提出该电子数据当事人基本相同的或类似的有形物“表象”。因此,在电子数据证据获取过程中,真实性检验标准是其可信性的关键。
(2)准确性、灵敏度(accuracy、sensitivity)。基于有形物的电子数据证据信息在纠纷中发挥作用的关键,是证明的重要序参量。所有种类的电子数据感应装置都能提供基于有形物的电子数据证据,例如监控视频和其他传感记录的影像形式,但电子数据证据的可信性问题更关注电子数据感应装置是否为我们提供了问题解决的必要程度。因为,从信息的角度来看,通信的基本问题是在将信息从一端精确地或近似地传递到另一端。在某些情况下,感应装置的准确性可能由于控制装置的设置不适当而造成数据信息衰减。对于基于有形物的电子数据证据而言,它是以电子形式反映出来的数据信息,采用的是计算机编码或其他复杂的程序,其准确性和灵敏度受到限制,本身未必可以直接反映所要证明的内容,往往需要一定的转化,必须通过质证,辨认可能削弱它们所含信息的准确性方面存在的瑕疵,法院才能采纳。
(3)可靠性(reliability)。基于有形物的电子数据证据是依据人类科学技术成果之一的电子技术而形成的,其“科技性”往往会让人们忽略对电子数据产生的软硬件系统质疑。虽然电子数据的高科技特性是不容质疑的,但电子数据并不是一种科学证据。
可靠论证要求不仅结构正确而且所有前提均真。当事人是利用何种技术措施对电子数据进行收集、怎样进行有效的保全,这是从技术可靠性的角度对电子数据的真实提出质疑。如何审查判断其来源的可靠性、传输过程的安全性等问题,不破坏电子数据真实性是需要通过专门技术来解决的。电子数据的收集、保全要在技术可靠的源头上保障电子数据真实可靠性。电子数据生成、传输设备是否符合规范的标准进行安装使用,其设备硬件的完整程度、软件系统运行成为电子数据的可靠性检验的要求。例如在案中
,法院参酌其他实务上的见解,认为一个可靠的过程,是可重复、可信赖或具有一致性的过程,提出证据的一方必须证明该数据的可靠性 (reliability)作为合适的基础(proper foundation),合适的基础必须是由可靠的设备,在日常业务活动有规律的实施中所记录与保存的数据,并且由管理人或其他有资格的证人出面作证,而这些数据还必须符合连续性及负责尽职性(conscientiously)。自然语言具有不确定性,但自然语言中的不确定性,不妨碍人们正确理解自然语言所表达的内容,也不妨碍人们思维推理的进行,因为人们是借助语言进行思维的,通常并不涉及过多的数学运算,不确定性人工智能可以解决语言文字中不确定性的形式化问题。分析基于不确定性人工智能获取语言性电子数据的可信性,需要从自然语言和人工语言两个角度来看。
(1)从自然语言的角度看,不确定性人工智能获取电子数据的可信性主要表现在以下两方面: 一是不确定性人工智能对自然语言不确定的判断。“语言的不确定性”是自然语言的普遍特征。Halliday在早期系统功能语法描写中提出了“盖然性”、“近似性”的概念,说明词汇的开放集合特征、方言学里两个因素的特征、两极归一性方法不能准确处理的语言事实,如人际功能系统的语气系统和情态系统里的多层次、多级别、多选项特征。
在文本层面,法国哲学家德里达指出,表意(signification) 总是一个指称其他符号的过程,没有仅指一个符号本身的符号,他认为这个过程是无尽头的参照过程,永远找不到意义本身。 语言文字中的不确定性,并没有妨碍我们的理解,反而会给人们带来无限的遐想。例如,唐代王勃的诗句“落霞与孤鹜齐飞,秋水共长天一色”,展现了一幅优美的画卷,这是精确数字无法替代的。不仅如此,一些自然语言在不同领域使用的不一致也会导致潜在且不必要的混淆。二是不确定性人工智能对司法常识的判断。人工智能领域普遍认为,有无常识是人和机器的根本区别之一,人的常识知识能否被物化,将决定人工智能最终能否实现。“在人类把握世界的各种方式中,常识是一种最基本和最普遍的方式,它是其他的各种方式(神话、宗教、艺术、科学、哲学、伦理等)得以形成和发展的基础。”常识作为“普通、平常但又持久、经常起作用的知识”,来源于经验,符合于经验,依附于经验,其最本质的特性就是经验性。正是在此意义上, 我们常常把经验与常识连用, 称为“经验常识”。这其中也有着太多的不确定性。如当代科学哲学家瓦托夫斯基说:“常识性知识的特征就在于:它既不是明确地系统的,也不是明确地批判的,就是说,既没有把它的所有各个部分同所有其他部分联系起来,也没有自觉地企图把它当做一个首尾一贯的真理体系。”另外,常识告诉人们的往往是表象,而不是本质。常识虽然“在一定的限制内足够精确,但它很难含有那种对事实为什么是它们被断言的那样的说明”。常识更多地让人们“知其然”而不“知其所以然”。更要注意的是,“常识有错的概率其实很高, 不仅因为时代的变迁,也因为认识的局限。”而不确定性人工智能只有将这些司法常识物化,才能真正实现人工智能推理判断。例如,法官判断案件事实重要的推理规则——经验法则,是人们从生活经验中归纳获得的关于事物因果关系或属性状态的法则或知识。经验法则包括一般人日常生活所归纳的常识。不确定性人工智能对于这些常识的判断,需要存在由大量背景信息(包含常识)所组成的“知识库”。特文宁教授认为“一个知识库”不是由那些业已经过了单独、实证检验并且已经清楚明确地作出的命题所组成的;相反,从个人和集体的角度看,在我们的头脑中都存在着一些错误定义的信息板块,而这些就典型地构成了一个知识库,它是一个容纳了具有良好理由的信息、深思熟虑的模式、逸闻趣事的记忆、影响、故事、神话、愿望、陈腔滥调、思考和偏见等诸多内容的复杂的大杂烩。经验法则本身不是法官作出裁决的事实根据,而是法官判断案件事实重要的推理规则,那么对于“利害关系”的分析,如果提供证据的主体与案件有利害关系,主体的可信性必然会受到影响,进而影响到其所提供证据的证明力。
(2)从人工智能的人工语言角度来看,人工语言是一类适应于人工智能和知识工程领域,使用符号处理和逻辑推理来编写程序求解非数值计算、知识处理、推理、规划、决策等具有智能的各种复杂问题的计算机程序设计语言。人工智能要解决的问题,需要建立一个包含事实和推理规则的知识库,计算机程序根据环境和所给的输入信息以及所要解决的问题来决定自己的行动。即借助计算机程序运行和人工智能算法能够更为严格地执行既定规则和逻辑。因此,人工智能是在环境模式的制导下的推理过程。虽然这种人工智能方法有极大自我解释能力和学习能力,但是基于确定性人工智能的人机对话,存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,无法有效地对上下文关系和谈话环境对本句的约束和影响进行分析,因此分析语言歧义、话语省略、代词的指向、同一句话在不同场合或由不同的人说出来,带有的不同语气所具有的不同含义等问题尚无明确规律可循,需要加强语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。这些问题不是一个容易的问题,需要运用人工语言,通过尽可能多地告诉计算机关于世界的知识来解决。
以前人工智能是基于复杂的形式化符号,忽略了即使是严谨的数学也是用自然语言来作为元语言支撑这一事实。不确定性人工智能可以使用不同风格人工语言编程以及设计计算机系统将知识与其推理方式分开,即形成不确定性人工智能的“陈述知识表示”。既然陈述知识表示与程序的其余部分保持分开,甚至更像自然语言而不是像计算机编码形式,因此,处理人机对话比较容易,而法律和法律观点经常发生变化,因此这对于法律适用来讲特别重要。
科学的电子数据证据分析方法,既是有效发现、识别电子数据证据的前提,也是准确判断电子数据证据价值、审视案件假说的基础。法庭在认定证据、查明事实过程中,需要遵循科学、可行的证据评估方案,从而确定如何基于大量复杂的电子数据得出特定的结论。通过掌握科学的电子数据证据分析方法,坚持理性的司法证明规则,有助于确保有罪的人得到公正审判,无罪的人不受刑事追究。不确定性人工智能正是通过对问题域的贝叶斯网络建模,用定性的语言概念替代定量的数值,形式化地表示电子数据信息中的规律性,使之能够为事实判定者提供分析结果或者发现电子数据信息连接点,实现电子数据证据分析的科学化。
人们对法的模糊性的认识由来已久,有思想家留下了对事物模糊性的经典咏叹:“当上帝本人用人类的语言对他们说话时,他的意思虽然一定是明确的,但是通过传达的朦胧媒介,也会使他的意思弄得含糊不清,疑问多端。”原因在于“模糊现象既来自用以观察的器官,也来自事物的本身”。电子数据证据的推论到处都存在着不确定性,因为吉尔伯特以盖然性为基础构建证据分类体系后,所有关于证据规则的论述都暗含着 “事实主张必然具有一定程度的盖然性”的思维, 这种盖然性通过逐层的推论最终转移到结论中去。例如,在概率推理中常用言词而不是用数字来表示电子数据证据的强度,因为我们没有根据来提供精确的单一概率值甚或概率区间,对它们的不确定性给予了深刻的认识,威格莫尔对证明力的分级方法,就是模糊概率或分档的例子。
正确认识过去事实的,只能通过对证据进行理性的推理而获得,证据法领域中大量使用模糊概率的修饰语,例如:确信无疑、清楚可信的证据、合理根据等。由于不能提供任何种类与其关联的精确且无争议的数字概率,因此法庭裁决标准必定是模糊的。不确定性人工智能对电子数据证据的分析中,则充分利用规则表示概念之间的关系,即定性知识,其进行推理时不要求给出被控对象的严密的精确数学模型,也不要求给出主观隶属度,更不去创造任何扩展了的模糊算子。由于电子数据规则发生器中的前件和后件中的概念,都可能含有不确定性,因此不确定性人工智能在输入一个特定的条件激活多条定性规则时,通过推理引擎,即实现带有不确定性的推理和控制。每次得到的输出控制值都具有不确定性,这正体现了不确定性推理的本质。
随机性和模糊性是不确定性的两个基本特征。因此,需要用概念的方法把握量的不确定性,这种方法比数学表达更真实、更具有普适性。由于人脑的思维不是纯数学的,自然语言才是思维的载体,与概念直接关联的语言值能够起到浓缩认知的作用,将客观世界进一步分类,并把概念结构的复杂性降低到可以掌握的程度,对事物和现象的感觉和知觉,在头脑中进行加工的过程中,概念起到了关键作用,以概念为基础的语言、理论、模型是人类认知和理解世界的方法。这需要对计算机已有的嵌入式、传统的人机交流的处理证据方式进行改进。
不确定性人工智能技术为电子数据的司法证明分析过程提供了科学性模型,即电子数据的定性定量转换的认知模型——云模型, 在这种证据分析模型中存有已经被验证了的知识和推理方式,实现了定性概念与定量数值之间的双向转换。即在论域空间中,大量云滴构成的云,可伸缩、无边沿,远观有形,近看无边,与自然现象中的云有着相似之处,所以用“云”来命名概念与数值之间的数学转换是很自然的。云成为运用语言值表示的某个定性概念与其定量表示之间的双向认知模型,用以反映自然语言中概念的不确定性,不但可以通过经典的概率论和模糊数学给出解释,而且反映了随机性和模糊性之间的关联,尤其是用概率的方法去研究模糊性,构成定性和定量之间的相互映射。具体而言,在海量电子数据集合中,用隶属度来刻画亦此亦彼的程度,隶属度相对于概率论中非此即彼的假设,是认识上的一大进步。
“在证明科学领域利用贝叶斯定理对事实裁判者的认知过程加以量化, 便成为这种‘古典盖然性’证明理论的现代化身”。但证据不是以统计意义上的概率为基础来计算的,什么是证据或什么不是证据需要根据特定情况去判断。我们所需要的不是计算每个命题真假可能性的数字方法,而是判断包含案件中所有相关证据的每个推论权重的整体方法,统计学家A.瓦尔德在1950年提出一种数理统计学的理论后,司法证明科学中将贝叶斯定理运用于证明责任以及在证据信息不确定情形下作出的判决。尤其是1986年J.Pearl教授通过对拓扑结构图和变量条件独立之间关系的研究后,提出了贝叶斯网络(Bayesian networks,简称BNs),BNs便成为不确定性电子数据的重要分析工具。
不确定性是诉讼的固有主观特征, 无论贝叶斯定理与我们在其他自然科学探索中所使用的方法有何不同, 它都为我们分析司法证明过程提供了帮助。
基于贝叶斯网络的不确定性人工智能将论证网络中推论的链接在一起。实现从整体上评价双方的论证,以判断一方或另一方是否履行了相应的证明责任。假设在获得电子数据证据的情况下,要重新评估待证事实的相关性概率,根据BNs, 电子数据证据的相关性主要取决于其能在多大程度上改变预先的可能性,而这又取决于假定该电子数据证据所主张的事实确实存在, 以及人们能够在多大程度上获得该项电子数据证据。这个概率称为后验概率(posterior probability),因为它关注的是我们获得这一新证据之后这个命题的概率。为了确定后验概率,需要两个要素。首先是先验概率(prior probability),它表示在获得新电子数据证据之前对这个命题为真的确信程度。其次是似然度(likelihood),它表示电子数据在把先验概率转变为后验概率过程中的强度和力度。从刑事证据分析来看, 电子数据证据分析的起点对犯罪嫌疑人所做的是无罪推定, 那么概率赋值为零, 随着其他证据的不断发现,概率值亦发生变化。威格莫尔正是通过运用精心的逻辑来找寻推论之事实支持的方式发展出了用于组织和评估诉讼证据的第一套体系。他认为,推理链条中待证事实之间的联系本质上是盖然性的,即推理链条中包括可疑来源或不确定性,他用言语而非数字描述了这些概率联系的强度。在很多场合中,我们没有根据来给某些事件分配精确的数字化概率,但又希望向其他人传达我们关于这些事件可能性的信念时,我们都会这样做。但威格莫尔也使用“力量(force)”这个术语来描述这些概率性联系的强度。一直以来,电子数据专家都认为本应可以预测到美国“911”事件的发生,因为美国情报机构已经收到一些信息,但他们未能“连接信息点(connect the dots)”,或者无法从大量数据中鉴别出某些有意义的琐事,这些信息从各种渠道流入不同的机构。如今大数据时代,数据流规模已经大到无法在一定时间内用常规数据库或者数据仓库的软件工具对其内容进行抓取、管理和处理,并快速获取有价值的信息。而数据库和数据仓库规模的迅速扩大,必然导致“数据丰富,信息贫乏,缺少知识”的尴尬局面。于是,从数据库中发现知识(Knowledge Discovery in Database, KDD)成为技术热点。根据系统科学中“结构决定功能”原理,可以将电子数据信息的元素抽象为节点,元素之间的关系视为连接,系统就构成一个具有复杂连接关系的网络。这些看似毫不相干、形态各异的真实电子数据信息网络常常具有某些相同的拓扑性质,受制于某些基本的演化法则。可以用拓扑势描述电子数据信息节点间的相互作用,将区域内电子数据视为拓扑势的局部高势区,通过寻找被低势区域所分割的高势区域,实现电子数据信息网络的划分,可以发现电子数据间具有不确定性的重叠节点现象,进而对电子数据信息节点进行分析。
在大数据时代,电子数据信息节点的重要性是显著的。有时少数度很大的关键节点决定着整个事实行为,绝大部分节点的度相对很小,构成无标度数据信息网络,并不能简单地把数据信息从它出现的语境中抽取出来,作为一般形式来使用。事实上,节点重要性不仅取决于节点自身的连接情况,还与邻近节点的重要性相关。一些电子数据从表面看来可能不包含关键的证据信息,但是通过不确定性人工智能技术分析海量数据,以及对多个数据库进行综合分析,最终完全可能通过推演得到关键的证据信息。区分生成假设与用可获得的相反数据验证它的必要性、信息过剩与相关和可信证据的缺乏产生的不同问题、歧义与不完整性之间的差异、对模糊证据进行选择性解释的价值,这些在具体案件中将会有一个存在争议的主要或基本待证事实,我们称为最终待证事实。用于决定原告或公诉人是否有权获得救济的法律规则,可被视为一个大前提。最终待证事实为小前提,如果电子数据证据对最终待证事实为真的确证,达到了所要求的确定性程度,那么裁决必须有利于公诉人或原告。
近些年来,人工智能虽然取得了很大成就,但许多是建立在确定性或者精确性基础之上的机器智能,不断暴露出因为其公理系统的强形式化,即所谓的严格、精确而带来的诸多局限,尤其是不能模拟人类思维过程中的不确定性。而案例的多少,以及案例中电子数据信息点的分布,反映了推理和控制中最关键的控制点,实际上表现出了输出和输入之间的非线性关系的拐点。这类非线性关系常常很难形式化,更难用精确的数学函数表达出来,利用不确定性人工智能的电子数据分析可以解决这一难题。
在大数据时代,需要不确定性人工智能的解决方案,以便迅速、有效地发现电子数据的证据价值,因为“放在天平上的分量不是证据的数量而是由证据产生的盖然性以及案件的全部环境决定的”。英国学者彼特·莫菲认为在民事案件中的证明标准就是,足以表明案件中负有法定证明责任当事人就其主张的事实上的真实性大于不真实性,即要求“或然性权衡”和“盖然性占优势”的标准
。而盖然性占优势证明标准意味着,凡是对于特定事实的存在有说服负担的当事人,必须以证据的优势确立其存在。证据的优势与证人的多寡或证据的数量没有关系。因为用于待证事实的证据不是一项数量标准,而是一项质量标准,反映了证据的可信度和说服力。