舒怡 毛国庆
关键词 “智慧法院” 智能化 信息化
基金项目:2018年度国家重点研发计划项目“智慧法院综合示范及效能评价”(项目批准号:2018YFC0831600)的阶段性成果;课题名称:“智慧法院总体设计、一体化应用平台构建及综合示范”的阶段性成果(课题编号:2018YFC0831606)。
作者简介:舒怡,北京国双科技有限公司知识与数据智能中心知识架构部总监;毛国庆,北京国双科技有限公司知识与数据智能中心知识架构部资深咨询顾问。
中图分类号:D926.2 文献标识码:A DOI:10.19387/j.cnki.1009-0592.2020.10.031
2020年3月,中共中央政治局常务委员会召开会议提出,加快5G网络、数据中心等新型基础设施建设进度,新基建涉及诸多产业链,是以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。新基建中,知识驱动是智能升级的核心,在建设体系设计中具有重要作用。在新基建背景下,结合司法改革和法院信息化建设的需求,知识也将成为智慧法院建设从信息化向智能化转型的核心驱动[1]。2020年6月30日,周强院长在“扎实做好民法典学习贯彻实施工作”的讲话中提到,“要加强智慧法院建设,加强数据中台建设,强化在线服务,深化人工智能应用,强化大数据驱动,为准确适用民法典提供强有力科技支撑”;其中,将数据中台建设和民法典适用相結合就是知识体系驱动信息化建设的一个最好场景[2]。
“万物互联、万物皆数”时代,一方面数据量飞速增长,愈加呈现出多源、多态、高维和异构的大数据特点;另一方面人工智能等新兴技术进入高速发展的快车道,从支持海量运算、复杂运算的计算智能、到基于大量学习语料的模拟感知智能、直至探索自动化的知识理解和知识推理能力的知识智能[3]。数据、信息、知识的DIKW金字塔框架模型的价值逐渐被重视,并从认知指导层面走向实践指导层面。知识以及领域的知识体系成为信息化向智能化转型的核心驱动。
从信息化建设的发展进程主要分为三个阶段:IT(Information Technology)阶段是传统信息技术时代,通过ERP、OA等流程性、管理性系统,以业务参与人自主填报为信息采集的方式,实现线下业务电子化,线上业务数据化,以用数据记录企业的业务活动为主要特点。DT(Data Technology)阶段是大数据时代,通过数据仓库、数据中心、数据平台等数据处理技术,实现数据的集成化和标准化,以“全域”数据的汇聚、治理为主要特点。KT(Knowledge and Data Intelligence Technology)阶段是知识智能时代,一方面通过机器学习、深度学习、神经网络等人工智能技术,实现了数据知识化;另一方与专家知识工程相结合,构建领域知识图谱,实现业务智能化,以基于领域知识图谱的行业智能应用为主要特点。
(一)与传统知识的比较
传统的知识体系,是某一特定领域内学习、工作、研究的组织,通过长期的训练所形成的一种“领域知识壁垒”。既有话语体系的壁垒、思维方式的壁垒,也存在应用技能的壁垒。传统知识体系一般是封闭的,知识的演化和推进是逐步发展的,具有可解释性的;知识的学习、理解和应用高度依赖于人。传统知识体系在一定领域内既有理论预设又有经验归纳[4]。一般体现为符号主义的专家系统。
传统的知识体系,忽视了大数据及在没有先验理论的情况下从数据中提取知识或者见解能力。
(二)与大数据比较
首先,我们这里的大数据是广义的大数据,既包括领域内能够获取的,具有信息价值的海量数据;也包括大数据挖掘相关的技术及挖掘结果。
海量数据和机器学习的技术突破,以及近年来人工智能在语音识别、图像识别等感知智能场景中取得的突出成就,使得“大数据认识论”成为知识工程领域的新范式。“大数据认识论”是一种去因果分析的概率认知,即对给定数据集进行相关性变量挖掘。知识发现的过程由技术和算法驱动,没有因果关系的介入。可以说大数据应用的最重要特征就是“追求相关、放弃因果” 。
大数据认知论在通识领域有很好的实践,但进入专业领域,由符号主义的专家系统向连结主义的概率系统转变出现了问题:第一,业务专家通过长期培训形成因果性分析方法,机器学习的不可解释性和专家的演绎思维发生冲突,使得机器学习的结果受到质疑,无法为专家提供知识辅助。第二,专家在个案业务处理过程中,依靠经验直觉。很多影响因果判断或者自由裁量的信息在过程中被逐步发现,逸散,无法沉淀为被学习的数据,进行机器学习。机器学习的结果精准度降低[5]。第三,政务、司法等业务办理过程中,依赖的规则或者说原则是复杂的,存在冲突、说服、共识的交互机制。机器学习和概率论认知缺乏必要的理论博弈和说理交互。
当然,我们不是要在专业领域内排除“大数据认识论”,而是要分场景、分业务、分权重双轨应用“决定论”(专家系统)和“概率论”(数学统计)。同时知识体系中涵盖的“大数据”,既包括有信息价值的“数据”本身,也包括实践中广泛存在的基于学习算法而实现规律挖掘的“大数据智能”。下文中将在智慧法院场景下进行详细阐述。
(一)法院现有业务支持系统可以分为案件办理系统、信息公开系统、办公系统
其中案件办理系统集群,根据法院的业务流程,以及服务的对象、功能的不同分列为各个服务子系统。以审判过程中相关的系统集群为例,如电子送达平台、破产平台、减假暂办案频台、审委会会议系统、庭审系统等,这些系统又和办案平台有一定的数据交互关系。上述系统的设计目标主要以无纸化办公、业务流程管理为主,知识的应用内核较少[6]。智慧法院系统工作原理大体可以分为以下几个部分:最高院系统中包括诉前、诉讼服务平台、电子送达、全国执行管理系统、执行监控、失信惩戒以及司法管理系统等。通用业务处理平台,其包括基础平台,诉讼类、审判类、执行类以及管理类通用组件。通用数据知识平台,其中包括通用业务数据、通用知识、通用信息化运行数据、立案信息、道交纠纷信息以及信息系统运行数据平台等几个部分。除此以外,还包括外部系统,是执行联动相关系统、公安、检察院以及司法局等系统。对外还包括全国通用司法公开相关系统。
(二)“认知”智能对知识体系构建的要求
自2015年起,最高人民法院编制并滚动式修订《人民法院信息化建设五年发展规划》,对智慧法院建设提出顶层设计需求,智慧法院一体化应用体系初步形成。发布了《最高人民法院关于加快建设智慧法院的意见》,智慧法院信息化建设“互联网+司法服务体系”逐步呈现。建立司法公开平台:以中国裁判文书网、中国审判流程信息公开网、中国庭审直播公开网、中国执行信息公开网为核心,实现了公开平台与各地办案系统的对接;建立了司法大数据管理和服务平台,实现了各地审判管理数据集中上报;建立人民法院信息可视化质效管控平台,具备对信息化运行数据进行集中管理的技术框架。同时,也积极探索执行、人事管理、档案管理、司法协助、破产重整、电子送达等全国统一系统。地方法院方面,智慧法院的顶层设计也有出台,上海法院2016年底制定《“数据法院”建设发展规划》(2017-2019),确定了法院信息化建设要以“一个战略”(大数据战略)“两个行动(‘互联网+‘人工智能+)”为驱动[7]。
在以上顶层设计设计之下法院信息化建设的发展体现出以下四个趋势:
流程管理系统仍然为法院信息化系统的核心;但智能辅助应用增多,辅助应用或以模块形式或以单独系统的模式与流程管理系统进行数据交换。比如根据流程系统中案件数据推送知识的类案推送系统;根据OCR识别的起诉书,解析信息项帮助法官填报流程系统的江西法院E助理系统,以及服务开庭的庭审语音系統和远程开庭系统等等的应用。
流程管理系统逐渐成为数据的采集和生成端,部分法院尝试建设大数据平台和数据中台,以改变数据只能沉积在流程管理系统内,流程管理系统升级各对接应用系统均需要进行调试的状况。大数据平台和数据中台的构建使得数据的存储脱离了流程管理的场景,更多的数据可以向平台中汇入,同时数据可以更好的进行融合、根据服务的不同业务需求进行异质性的标签化处理,较好的解决数据应用标准和数据规范化问题。
数据利用增加,数据中台的理念使得各法院对于数据的应用有了更大的想象空间。法院开始尝试为当事人提供司法数据服务,基于数据统计分析的当事人司法辅助系统,调解平台、问答系统在浙江、山东都有落地。
在数据利用增加的同时,知识的检索、知识与办案系统的结合也成为了新的信息化建设方向。比如2019、2020年两次在最高法两会报告中国提到的法信系统,为法官提供了法律法规、裁判文书、专家观点、图书期刊等多类知识数据,并实现各类数据之间的关联。同时根据知识的分析和推送,优化的文书写作系统,工具型系统也借助知识智能进一步升级,比如庭审语音系统,开始尝试利用语音直接进行文书的生成,个别法院的远程开庭系统法官端有法条检索和知识推送的功能等。
当然智慧法院的应用也出现了一些问题,比如法律解释是法律知识表达的核心问题,其中包含人类特有的价值和目的考虑,具有极强的主观能动性。个案中,基于数据的概率计算结果能否正确替代知识表达,需要进一步的知识验证。而现有系统,由于没有对于知识的准确定义,知识查询、知识推荐的结果差异较大。还比如有的人工智能模型开发所依托的数据不完整或者模型构建中因缺乏对法律常识的理解在数据采集上出现异质性偏差。这些问题可以用专家知识和专家经验去进行修正。
以刑事犯罪网络挖掘为例 ,如美国学者在描述犯罪网络挖掘时所提供的资料显示,不同的挖掘算法给出的结果是有差异的,和根据有经验的检察官给出的结论也存在一定的距离。因此在特定领域中,专家知识和专家经验是非常重要的。
上述趋势和问题实际上反映出的是智慧法院发展对“认知”智能发展的要求,而“认知”智能发展需要知识内核的驱动,对智慧法院知识体系构建提出要求。
不论以怎样的方法开展智慧法院知识体系的建设,对于司法知识处理技术逻辑和流程是一致的。知识来源可以是文本型知识,也可以是实践演绎型知识,知识初步处理后需要进行验证与优化,验证和优化后的知识都需要在司法场景中进行映射。在场景中映射的知识可以进行量化分析和趋势分析,进一步对其中具有因果关系的部分进行影响机制分析。同时知识在处理后仍然作为知识流的一步分进行流转,通过知识
库和知识在应用系统中的嵌入实现知识对行为的干预,以及知识的有效性评价。司法知识的构建逻辑具体包括以下几个方面:知识来源,主要是对文本型知识拆解,结合实践演绎。进行文本型知识拆解与应用主要是初步构建、验证与优化,知识在司法程序中的映射,结合实践经验中的知识积累,为文本型知识拆解提供帮助。之后进行知识体系运转,进行数据统计、知识流转。司法知识体系工程,通过本文类知识的拆解、应用以及知识系统评价;知识驱动的智慧法院建设;经验知识的识别、验证、评价以及积累。
知识以及领域的知识体系成为信息化向智能化转型的核心驱动已经成为行业共识和建设的发展方向。现阶段,知识内核对于一般的司法行为或者行政行为不应盲目直接干预,更需作为一种决策辅助手段予以提供。这是因为,一方面专家系统或数据挖掘所提供的知识,往往是有局限性的,是“过去”的探索结论;在新的环境下,新的信息可能难以被捕捉,以致无法影响现有知识内核系统得出“新”的结论和建议。另一方面,人的价值判断是司法和行政行为中非常重要的环节,比如“比例原则”的适用,往往需要具体事件在具体环境中考量,這一部分价值判断是目前的知识内核系统无法替代的。
注释:
王禄生.论法律大数据“领域理论”的构建[J].中国法学,2020(2).
杨焘,杨君臣.人工智能在司法领域运行的现状及完善对策研究——以成都法院为样本进行分析[J].科技与法律,2018(3)(总第133期).
PaoloCampanaa, FedericoVareseb:Studying organized crime networks: Data sources, boundaries and the limits of structural measures,Paolo Campana and Federico Varese, Social Networks, https://doi.org/10.1016/j.socnet.2020.03.002.
参考文献:
[1] 杨临萍.司法体制改革与智慧法院的实践与探索[M].法律出版社,2019.
[2] 吕艳滨.人民法院信息化3.0版建设应用评估报告以山东法院为视角[M].中国社会科学出版社,2017.
[3] 王昊奋,漆桂林,陈华钧.知识图谱:方法、实践与应用[M].电子工业出版社,2019.
[4] 赵军.知识图谱[M].高等教育出版社,2018.
[5] 曾鲲.大数据时代如何构建智慧法院——以1059名法官的访谈实录为样本[J].东南司法评论,2019(9).
[6] 黄晓云.智慧法院:以现代科技应用助推司法改革[J].中国审判,2017.
[7] 高晓桐.关于智慧法院建设现状的思考[J].法制博览,2019(8).