从通用化走向专门化：反思中国司法人工智能的运用

2020-02-25 09:44左卫民

法学论坛 2020年2期

左卫民

(四川大学法学院，四川成都 610065)

引言

近年来，随着大数据、人工智能技术的兴起与发展，人类社会仿佛一夜之间进入了一个崭新的“智能纪元”，中国法律界似乎也紧紧跟上了这股人工智能风潮。2019年世界互联网法治论坛，笔者与来自多国的司法官员、专家学者就司法(法律)人工智能的应用问题进行交流时，(1)本文所指司法为广义的司法概念，所以公安机关运用的人脸识别等人工智能也在本文探讨的司法人工智能之列。另外，需要指出的是法律人工智能是一个更广泛的概念，但在司法领域中的法律人工智能使用司法人工智能来指称更适宜。亲身感受了这场人工智能技术风暴如何席卷全球法律界。与此相关，司法(法律)人工智能成为近两年中国法学理论界和实务界俏热一时的话题。一方面，理论界围绕人工智能这一新兴事物展开一场新兴技术与传统理论的大讨论。(2)理论界对于人工智能的探讨热度从“中国知网”相关文献的数量及增长情况便可见一斑。以“人工智能+法律”为主题词进行文献检索，2016年之前几乎无人关注，仅有10篇，2016年开始引起较为关注，增加到62篇，2017年继续增加到288篇，2018年爆炸式增长到749篇，而2019年更是增长到了2009篇，可见人工智能与法律的结合成为了近两年广泛关注的话题。例如人工智能对既有法学理论带来的问题与挑战、(3)王利明提出，人工智能对我们的民事法律制度提出了挑战，人格权制度、数据财产保护、知识产权保护、侵权责任认定和承担等，都需要随着人工智能技术的发展而作出必要的调整，参见王利明：《人工智能时代对民法学的新挑战》，载《东方法学》2018年第3期。周佑勇提出，人工智能的技术特征产生了特有技术风险，它潜在地可能对现有秩序产生高烈度冲击。因此，智能时代法学理论需要回应个人信息使用规则重构、算法规范路径创制、法律主体观念更新和法律归责体系迭代的时代需求，参见周佑勇：《论智能时代的技术逻辑与法律变革》，载《东南大学学报(哲学社会科学版)》2019年第5期。郑戈提出“现代”法律体系能否成功应对人工智能所带来的新的风险和不确定性能否在人工智能时代继续维持秩序与变革、守护与创新、价值与事实之间的动态平衡，这是今天的法律人所必须面对的紧迫问题。参见郑戈: 《人工智能与法律的未来》，载《探索与争鸣》2017 年第10期，等等。人工智能运用中产生的信息公开和透明化等法律问题、(4)胡凌指出所有软件/算法都可能朝向自动收集数据，做出决定或判断的趋势，由于算法的复杂性，算法带来的结果可能无法预测，并在更大范围内带来系统性的不利后果。参见胡凌：《人工智能的法律想象》，载《文化纵横》2017年第2期。人工智能在法律领域的运用等现实问题。(5)吴习彧对人工智能进行司法裁判的相关问题提出了思考，参见吴习彧：《司法裁判人工智能化的可能性及问题》，载《浙江社会科学》2017年第4期。左卫民就法律人工智能在中国的话语层面热度高涨却在司法实践运用层面遇冷的悖论现象进行了分析，参见左卫民：《热与冷：中国法律人工智能的再思考》，载《环球法律评论》2019年第2期。另一方面，实务界也迎上了这股风潮，甚至在某种程度上走在了理论界的前头。在中共十九大报告(6)中共十九大报告中提出要“推动互联网、大数据、人工智能和实体经济深度融合”，参见习近平：《决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告》，http://cpc.people.com.cn/n1/2017/1028/c64094-29613660.html。最后访问时间：2019年10月9日。、国务院政府工作报告以及《新一代人工智能发展规划》(7)《国务院关于印发新一代人工智能发展规划的通知》，http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm，最后访问时间：2019年10月9日。等中央有关文件的支持下，智慧警务、智慧检务、智慧法院等规划方案纷纷出台，在司法人工智能的探索之路上跃马扬鞭。但是，话语的轰轰烈烈并不等同于实践的有效展开，况且，这种热闹背后也许隐含的是司法人工智能研究的空泛化、泡沫化。我们似乎应当警惕逐利者迅速涌入又迅速抽身离去后的一地鸡毛。笔者认为，传统上保持审慎、理性的法律行业更需要克制，应当对司法人工智能的现状有足够清醒、客观的评估。

一、个别开花：司法人工智能的运用现状

纵观运用实践，笔者的整体看法是：到目前为止，司法人工智能在实践中取得了一定成效，但其运用现状仍难称理想，至少大部分的实际运用并未达到开发者或使用者先前所期待的功效，故而只能被称作“个别开花”。应当肯定的是，司法人工智能目前已取得一定效果。这种成效主要集中在两个领域：

第一是警务活动中较好运用。典型运用如人脸识别技术，被广泛布置于机场、车站、广场等人员密集区域，能自动捕获、抓取动态人脸图像，并与公安机关数据库中的图像进行比对、核实。其已在公安机关的侦查活动中发挥重要作用，使演唱会上抓获逃犯等新闻频登头条，成为公安机关追捕逃犯的得力助手。(8)例如2018年接连出现人脸识别技术在演唱会上抓获逃犯的新闻。参见郑博超：《张学友能“神助攻”，世界杯也行》，载《检察日报》2018年6月13日。尽管人脸识别技术引发了一些隐私权方面的争议，(9)参见张晔：《当人脸识别遇上隐私，立法应紧跟》，载《科技日报》2018年7月6日；张凯伦、王倩：《“刷脸”的风险，你知道多少？》，载《检察日报》2019年4月17日。但应用实效毋庸置疑，其在实践中的运用也是相当广泛。

第二是司法辅助活动中的相对有限运用。典型运用如“智慧法院”建设中推出的庭审智能语音识别、电子卷宗生成、类案推送、量刑辅助、法律问答机器人等等，这些运用似乎在某种程度上满足了当事人的需求，减轻了法官的工作量。同时在司法活动中也开始发挥提高效率、节约司法资源的作用，但其效果似乎相当有限，在司法实践中并未如预期般普遍运用。更重要的是，其中一部分技术虽被冠以“智能”的称谓，但其是否属于真正意义上的人工智能可能还存有争议，尤其是其是否体现出类人类一般的自主思考能力这一人工智能最为核心的“拟人性”特征更值得商榷。具体而言，在以下运用实例中有所反映：

其一，电子卷宗生成技术、网上办案平台、在线庭审等技术，(10)关于电子卷宗生成技术的运用，例如上海市高级人民法院于2017年10月发布《上海市高级人民法院关于建立完善电子卷宗随案同步生成系统的实施方案》，在全市法院全面推广电子卷宗随案同步生成和深度应用工作，在立案、审理、执行等各个流程阶段和各个诉讼环节所产生的诉讼文件、所实施的诉讼活动，都要同步转化为电子数据，纳入案件办理系统中去。参见黄安琪：《上海法院全面推进电子卷宗随案同步生成》，http://www.xinhuanet.com//mrdx/2017-11/01/c136719710.htm，最后访问时间：2020年1月29日。关于网上办案平台与在线庭审技术的运用，例如浙江移动微法院小程序，浙江全省法院当事人和律师打开手机微信浙江移动微法院小程序，可进行网上立案、在线调解、在线庭审、申请执行。参见王春：《浙江全省上线移动微法院4.0版》，载《法制日报》2018年9月11日。其核心仍是一种电子化的信息处理方式，旨在实现法院办案方式由纸质向电子、由线下向线上的转变，其间并未体现计算机自主思考后进行加工的“额外知识”，而仍是需要由人进行操作的信息化方式(尽管这种操作手段可能进行了更新)。简言之，其运用模式是“人+电子化”，(11)法院的信息化建设是AI运用的基础，但并不等于AI运用本身。在外国，AI的运用也被看作深化法院信息化建设，特别是在线纠纷解决的一种发展方向。参见: Amy J. Schmitz，EXPANDING ACCESS TO REMEDIES THROUGH E-COURT INITIATIVES，67 Buff. L. Rev. 89,2019,p.146.或者说是数字化、在线化。

其二，庭审语音识别、卷宗OCR识别，(12)浙江省高级人民法院自2016年3月开始启动智能语音识别项目的研发工作，并在全省法院推广。智能语音识别系统专门针对法院工作场景开发，主要为庭审、调解、合议、听证、审判委员会讨论、制作文书、文书校对、12368诉讼服务热线等办案环节提供语音转写服务。参见孟焕良：《浙江法院智能语音识别系统全面上线》，载《人民法院报》2016年9月19日。北京海淀法院以OCR技术为基础，将高扫仪生成电子材料自动回填至审判系统，实现图片内容到文本信息的转换，参见林挚：《北京海淀法院上线“一键归档”》，载《人民法院报》2019年9月22日。其属于典型的感知智能技术，在智能化程度上相较于传统录音、扫描等信息技术等有了相当程度的提升，但是其并非专门针对司法活动开发的人工智能，未能将通用的感知智能技术转换、发展为专用的司法感知智能技术，从而也未能解决复杂的法律场景难题(如法庭审判中多方互动及争论场景)，所以在当下的审判实践中也未获得普遍运用。(13)例如上海第二中级人民法院的法官指出庭审语音识别技术也存在使用率不高、易用性不足的问题，除个别法庭使用较好外，民事庭、刑事庭等法庭的适用率仅为21.69%、27.69%、12.54%。参见朱川、孙咏玄、玉宝、沈俊、卢腾达：《庭审语音识别转写系统优益与配套机制研究》，载《人民司法》2018年第19期。也有研究者从技术开发的角度，指出当前类案识别准确率偏低，原因在于技术上的瓶颈和一线开发的技术人员往往未能准确定位一线法官对类案推荐的实际需求。参见王禄生：《司法大数据与人工智能开发的技术障碍》，载《中国法律评论》2018年第2期。

其三，类案推送系统，其在主动推送类案层面看似具备了些许智能化的因素，但在实践中的运用却并不如预期般有效。一方面，开发群体过多导致类案标准混乱，除了最高法院开发的类案推送系统，多个地区的高级法院也开发了类似的系统，而各自的系统又分别由不同的法律科技公司设计、研发，从而使得检索结果不一致。(14)例如除了最高人民法院的类案智能推送系统，还出现了贵州省高级人民法院的类案裁判标准数据库，北京市高级人民法院的睿法官系统，重庆市高级人民法院的类案智能专审平台，等等。参见郑通斌：《类案检索运行现状及完善路径》，载《人民司法》2018年第31期。另一方面，智能化程度有限使得检索推送案例不精确、案由覆盖率不足，无法解决法官实际需要。(15)例如有法官指出类案推送的案例常常不区分地域、不区分效力层级、不区分是否是裁判文书原文，而统一采用要素匹配的方式进行推送，混乱显而易见。参见朱彬彬、祝兴栋：《类案推送的精细化：问题、成因与改进——以刑事类案推送为例》，载《法律适用》2018年第20期。有研究者经过实证调研发现目前的类案推送系统存在检索推送案例不精确：范围过窄、来源不明、层级不清，以及地方各司法机关检索系统不统一、检索结果不一致等问题。参见左卫民：《如何通过人工智能实现类案类判》，载《中国法律评论》2018年第2期。

其四，法律问答机器人。其在外观上似乎更近似一般认知中的人工智能想象，但就实际运用而言，所谓的问答，大多要以点击相应问题的固定模式或采用相对专业的提问模式进行。这是由于法律问答机器人的信息库相对封闭，无法自主产生额外信息，所以如当事人与法官面对面沟通般不固定、自如的问答模式无法完全实现，其实质上更类似于一台诉讼信息汇总的计算机。(16)参见周佑勇：《智能技术驱动下的诉讼服务问题及其应对之策》，载《东方法学》2019年第5期。这种信息在信息爆炸、网络技术高度发达的当下，通过查询书籍、网络等方式同样不难获取，(17)例如延安中院的法律服务机器人“圣地小法”，其功能包括法律咨询、智能问答、法律法规查询、案例推送等，主要目的在于帮助当事人了解案件流程，掌握相关法律规定，以及根据案情作出初步判断。参见惠兴文：《延安中院“圣地小法”正式上岗》，载《人民法院报》2017年10月11日。再如北京第一中院的法律服务机器人“小法”，其功能也是帮助当事人查询法条、诉讼程序，以及同类案件的审判情况等。参见《法律机器人进驻北京法院提供智慧诉讼服务》，http://www.xinhuanet.com/legal/2017-10/12/c_1121794505.htm，最后访问时间：2020年1月29日。所以问答机器人只是便捷程度的有限提升，而非理念、方式的全面升级。

虽然这些运用集中于较浅层面，但探索的正面意义仍值得肯定。不过在肯定之余更需警醒的是，无论是在警务活动还是司法辅助性活动中，这种运用只能算作基础性的浅层探索，当下的司法人工智能整体上仍然是一种浅度人工智能运用，与理想中的人工智能尚存很大差距，所以，当前司法人工智能还有待大幅提升。同时，由于发展的不成熟，市场上还充斥着大量的“伪人工智能”，有学者便指出当下人工智能的自主性与机械自动化的混淆现象，将一些典型的自动化技术与人工智能技术混为一谈。(18)参见刘艳红：《人工智能法学研究的反智化批判》，载《东方法学》2019年第5期。这种混淆，可能源于法律界对人工智能技术的陌生与误解，也可能是由于追逐学术热点而主动强加的概念附会，对于后者，尤需警醒。

综上所述，就现状而言，当前司法人工智能的实际运用在深度和广度上都相当有限。在深度上，目前司法人工智能在实践中仍限于充当辅助法律人决策的角色，仅适宜作为法官裁判的助手而不能完全替代法官。从提高工作效率的角度而言，其可能更适宜于处理技术性、辅助性的工作。在广度上，司法人工智能被集中运用在警务活动及司法活动的少部分环节，在通用技术相当成熟的如人脸识别、语音转换领域比较成功。同时，在技术要求不特别高、已有适当投入并成功克服难题的领域(如数据的电子化)，其运用也相对成功。但在关涉效率与公正等司法决策的真正疑难问题上，司法人工智能的应用仍是浅尝辄止，存在应用不多、不具体、实效不够等问题。

二、何以如此：通用化的成熟与专门化的缺失

何以出现上述小范围开花、大范围失意的鲜明对比？笔者以为，主要有以下几点因素。

其一，司法人工智能小范围的成功是源于成熟人工智能技术的普适性适用。目前发挥较大作用的司法人工智能运用如人脸识别技术、语音识别等感知智能技术，一方面均是先在商用、民用领域研发并使用的通用技术，这些技术经过长期的广泛实践与反复改进已趋于完善。另一方面，这些技术在司法活动中的运用场景与普通的商用、民用的运用场景在本质上是一致的，其实质是通用技术在司法领域的直接复制，例如警务活动中使用人脸识别追逃与商业公司使用人脸识别抓取数据依赖同一种技术逻辑。再如语音识别(转换)技术，无论是在庭审中使用，抑或是在商务会谈、学术会议中使用，虽然运用场景有所不同，其核心需求均是将语音转换为文字，即使由于司法活动(尤其是庭审活动)的特殊性，导致语音的识别具有一些额外的要求，但仅仅是技术难度上的区别而非技术逻辑上的相异。因此归根结底，司法人工智能的部分成功运用是由于成熟技术本身的无障碍，而对于其它司法活动而言，其技术需求便不仅限于这些通用技术，而是需要为司法运用“定制”一套专门技术，其间必然涉及供需双方的有效沟通、人工智能知识与司法知识的深度融合以及研发技术的高度成熟，其开发无疑是“另起炉灶”且难度往往高于通用技术。所以，当没有成熟的“专用化”的人工智能技术应对司法活动的大部分问题时，目前小范围开花的尴尬局面也就顺理成章。

二是司法人工智能产品的现有技术未能克服司法实践难题，也未适应司法规律与特征。技术开发没有真正掌握司法活动的“痛点”，而是将人工智能技术往司法活动上“硬套”，其结果是在一些外围式、边缘式活动中有所成效，但在主要、核心的活动中却难以配套。当然，也应当承认人工智能技术与司法活动的有效结合存在一定客观困难。司法活动有其独特性，是凝结了法律人智慧的判断性活动，因此人工智能要想在司法活动中真正发挥作用，需要理解其特殊性，并不断模拟和练习法律人的思维。而这种法律人思维的模拟并非易事：一是需要足够的模拟基础来源即数据。目前，我国的司法数据公开取得了长足的进步，裁判文书网成为了全球最大的官方司法判决书公开网站，尽管裁判文书网上传文书数目巨大，但是却并不能刻画出审判活动的“冰山全貌”，因为仍有数量众多的文书未上传，在已上传的文书中，排除文书信息不真实、不客观的干扰，想要对其进行有效的数据模拟，仍需经过数据清洗、数据标注等多重加工步骤。二是人工智能需要有适配司法领域的算法。相较于通用领域，司法领域尤其强调逻辑性和论证说理。在此影响下，司法领域人工智能算法的把握力与可解释性就显得更为重要。以量刑辅助的人工智能研发为例，在模型训练过程中，研发主体可以依托神经网络、决策树等不同算法，每种算法的准确性和可解释性也有所不同。在司法人工智能的开发中，除了考虑算法结果的准确性外，选择具有可解释性的算法并进行领域优化就至关重要。(19)参见王禄生：《司法大数据与人工智能技术应用的风险及伦理规制》，载《法商研究》2019年第2期。

三是所投入的资金人才资源不足与投入模式不佳。应当承认的是对于司法人工智能的投入，其绝对数量相较于其它人文社科已属不少并且仍在逐步增加之中，只是相对于人工智能领域所需要的投入量而言，目前的投入仍显得相当有限。一方面是国家层面的投入有限，由于法律归属于传统的人文社科，其研究经费投入本身难以与需要搭建实验室的理工科相提并论。但是，司法人工智能显然已经难以再归属到传统意义上的人文社科当中，对其研究也需要更多的资金投入，甚至也需要建设法律人工智能研发的“实验室。”(20)实际上，已经有科研机构构建起了类似的实验室，例如北京大学法律人工智能实验室。参见《引领法学知识生产、推动法治人才培养、助力法治发展进步——北京大学法律人工智能实验室、北京大学法律人工智能研究中心成立仪式暨第一届北京大学法律与人工智能论坛成功召开》，http://www.law.pku.edu.cn/xwzx/xwdt/58007.htm，最后访问时间：2020年1月27日。因此，从国家层面而言，需要革新将法学一概视为传统人文社科的视域，从国家研究经费方面给予司法人工智能领域更多的资金和人才支持。另一方面，或许更为重要的是社会层面的投入亦远远不够，当然，这或许与司法领域并非具有高回报率有关，就连号称人工智能第一股并且与法律行业合作密切的公司，其部分利润可能也源于政府补贴。(21)在科大讯飞2018年年报中，科大讯飞获得政府补助总额2.85亿元，占比净利52.58%，意味着半数净利所得，离不开政府补助。参见《科大讯飞年报出炉，2018日赚148万元，53%是政府补助》，http://finance.sina.com.cn/stock/s/2019-04-19/doc-ihvhiqax3905503.shtml，最后访问时间：2020年1月27日。科技公司不愿投入过多资源开发仅在法律领域适用而无法普遍使用的产品，而法律领域的消费者又“购买力”有限，往往无法独自承担定制法律专用人工智能产品高昂的研发成本。因此，也就形成了目前司法人工智能开发多是某些地区甚至某个司法机关与科技公司单独合作的“小打小闹”局面，这样缺乏统一规划、个别化的投入模式使得投入产出率不高，其结果往往是投入的资金和人力未能得到充分使用，产出的人工智能产品也无法有效运用。

三、未来展望：从通用化走向专门化

针对上述问题，未来的司法人工智能到底路在何方？笔者以为可从以下方面努力：

第一，降低对司法人工智能的盲目期待。尽管人工智能技术的发展一次次打破人类的传统技术认知界限，但也要警惕人工智能的万能论，即无论在何种领域，人工智能都能完美替代人类。司法活动尤其是审判活动应当如此吗？近年来，智慧司法建设如火如荼展开，人工智能似乎大有替代法律人之势。但是细想之下，司法活动本身便凝聚着人类的智慧，即使用AI法官来替代人类法官的愿景美好，但这种期待一方面高估了当下人工智能的发展程度——即使在人工智能技术最为领先的美国也未研制出能在审判活动中完全替代人类法官的人工智能产品。另一方面，也低估了人类法官在司法活动中独特的审判智慧，审判活动从古代神明裁判发展到当下的证据裁判，是一种非理性到理性的演变过程，这个过程中无疑彰显着诸多审判智慧，即哈耶克所谓“从长期审判实践的经验和丰富的观察中获得的可靠而周密的判断力和裁决力”。(22)[英]冯·哈耶克：《经济、科学与政治——哈耶克论文演讲集》，冯克利译，江苏人民出版2003年版，第584页。在古代中国，便出现了五听断狱的审判技巧，即通过表情、气色、声音等方面来综合定案。再如将审判和调解相结合的马锡五审判方式，其对人情事理的精到把握是冰冷屏幕中的AI法官所不具备的。有研究者甚至认为“人工智能对审判经验的吸收和设计者对经验的标准化和规范化总结仅是审判所需经验的很小一部分，人工智能仅是对智性部分模仿的初级阶段。”(23)潘庸鲁：《人工智能介入司法领域路径分析》，载《东方法学》2018年第3期。因此，“我们应当充分认识到法律人工智能的运用是一个长期性、艰巨性的过程，并将面临艰巨挑战。热闹的现象并不表明中国已经进入了法律人工智能时代，更不意味着市场已经有了成熟的法律人工智能产品。”(24)左卫民：《关于法律人工智能在中国运用前景的若干思考》，载《清华法学》2018年第2期。

第二，研发重心从通用领域转向司法专用领域。当下通用领域的人工智能应用已经取得了一定的进展，但需要有清醒认知的是，在司法领域中通用技术的使用似乎已经快要触及“瓶颈”，其技术已经难以满足司法的独特性需求。(25)参见刘艳红：《大数据时代审判体系和审判能力现代化的理论基础与实践展开》，载《安徽大学学报(哲学社会科学版)》2019年第3期。因此，对于今后司法人工智能技术的发展方向，应当明确的是，要立足于司法活动的专业特性，尤其是要着眼于审判等核心活动的技术需求进行深耕，挖掘司法实践对于人工智能的真正需求点。(26)例如，对域外法院开始利用AI来对案件结果进行预测、对专家证词的采信等利用方式，我国在研发时就可以结合中国实际来开发相应的产品。有关民事审判案件中，AI对案件结果预测之运用，可参见： Richard C. Kraus, Artificial Intelligence Invades Appellate Practice: The Here, The Near, and The OhMyDear,A.B.A.(Feb.5,2019),https://www.americanbar.org/groups/judicial/publications/appellate_issues/2019/winter/artificial-intelligence-invades-appellate-practice-the-here-the-near-and-the-oh-my-dear/. 有关AI辅助专家证词之采信问题，可参见：Pamela S. Katz, Expert Robot, “Using Artificial Intelligence to Assist Judges in Admitting Scientific Expert Testimony”, 24 ALB. L.J. SCI. & TECH Vol.41,No.1,2014.否则，即便继续运用通用技术展开外围性研发，但始终无法触及司法活动的核心需求，其收益将会边际递减，也慢慢消耗着司法实践者对其的期待和耐心。

第三，司法人工智能的投入从地方、部门主要参与转为统一规划，投入重点从通用技术转向司法专门领域。毋庸讳言的是，司法人工智能的开发需要成规模的资金投入，业内俗语“有多少人工便有多少智能”便道出了其中的奥秘，这种投入的量级并非过往司法机关进行技术设备升级的投入可以相提并论，而地方司法机关如法院、检察院的资金源于财政给付，任何一项支出均需要制作详细的预算，进行司法人工智能研发所需要的大规模投入显然是有限财政投入所难以独支的。因此，不从投入来源考虑而盲目要求加大投入无疑是隔靴搔痒。笔者认为，继续加大对于司法人工智能的投入需要从根本上进行投入模式的转变：从目前的地方、部门参与转变为高层统一规划，(27)值得关注的是，目前，中央政府包括中央司法机关已经在规划并落地相关的研发项目，例如科技部2018年发布的国家重点研发计划“公共安全风险防控与技术装备重点专项”(司法专题任务)，第一批投入4.5亿元(总投入达9亿元)，来专门研究司法领域的科技问题。参见王禄生：《司法大数据与人工智能开发的技术障碍》，载《中国法律评论》2018年第2期。并且资源投入的重点要向专门化的司法人工智能倾斜。虽然地方、部门投入具有充分利用本地、部门资源、针对本地、部门需求开发等优势，但其弊端也显而易见。一是缺乏统一的技术标准。这导致开发的司法人工智能适用范围极为有限，甚至只能在本院适用，大大限缩了技术的广泛性。全国各地的司法人工智能到处开花，却又花开各异。二是投入的规模有限。以当下司法人工智能领域的研发经费为例，尽管数千万的项目经费在法律领域已属罕见，(28)例如东南大学法学院2018年获得的国家重点研发计划“面向诉讼全流程的一体化便民服务技术及装备研究”，项目总经费为7124万元，其中中央财政经费为2324万元。参见《国家重点研发计划项目“面向诉讼全流程的一体化便民服务技术及装备研究”启动暨实施方案论证会顺利召开》，https://law.seu.edu.cn/2018/1223/c9375a255804/page.htm，最后访问时间：2020年1月27日。但与人工智能研发所需的巨额投入相比仍是杯水车薪。全球知名科技公司对AI的研发投入更是以十亿甚至百亿计。(29)2018年的全球研发投入排名中，谷歌母公司Alphabet以133.88亿欧元排名第二，微软以122.79亿欧元的研发投入位居世界第四。而在具体针对AI的研发投入中，IBM已经在Watson平台上投资150多亿美元，美国科技大亨伊隆·马斯克(Elon Musk)斥资10亿美元支持成立AI研究公司OpenAI，谷歌花费4亿英镑收购了研发出AlphaGo的DeepMind公司。参见《2018全球企业研发投资排名》，https://tech.sina.com.cn/it/2019-01-01/doc-ihqfskcn3196887.shtml，最后访问时间2019年8月25日。这种投入的规模显然是地方财政所无法承担的，而投入资金的有限性则阻碍了技术的成熟程度，最后研发出的司法人工智能产品往往由于技术的缺陷而难以在实践中运用。三是投入的持续性不足。单个司法机关的独立投入可能难以长期持续，并且希冀于中短期内能有相应“成果”，而这可能与高科技研发的规律背道而驰。科技公司对于AI的研发投入往往是“烧钱”进行试错，然而地方、部门一旦长时间无法研发出产品，可能难以承担如此高昂的成本。显然来自于顶层设计的统一规划具有相当程度的优势：首先，司法权本质是一种中央事权，将司法领域运用人工智能技术的主导权牢牢抓在顶层手中是一种最为稳妥的方式。其次，对于司法人工智能技术运用的规划更具整体性、统一性和权威性。相较各地司法机关的单兵作战，来源于顶层设计的统一规划无疑会使法律人工智能运用的开发更具目的性与前瞻性，某种程度上降低了地方部门各自为政的试错率。再次，来自于顶层设计的主导能提供更大规模、持续性的开发投入，这不仅包括资金投入，也包括政策支持、人员投入。

第四，实现研究范式转向实证研究。当下司法人工智能是理论界的研究热题，但是对于这道热题的回应却是“新瓶装旧酒”，中国法学理论界对于司法人工智能的研究路径仍局限在话语层面反复讨论司法人工智能的可能性、风险性等通用、概括的问题，(30)参见左卫民：《热与冷：中国法律人工智能的再思考》，载《环球法律评论》2019年第2期。而对“司法人工智能具体运用”提之甚少。实际上，理论界对于实际运用问题的关注，也会在一定程度上推动司法人工智能的实践运用。以统计学为重要根基的人工智能，似乎天然便与传统法学难以“相融”。传统的法学以理论分析见长，对于数理统计分析涉及甚少。近年来，在一批学者的倡导之下，“以数据说话”的实证研究方法在法学领域开始逐步有了一席之地，但仍属小众。(31)中国法律实证研究最早在刑诉领域展开，一批刑诉学者兴起了实证研究的学术风潮。例如白建军早在1999年便开始使用实证研究方法，参见白建军：《刑事学体系的一个侧面：定量分析》，载《中外法学》1999年第5期；白建军：《犯罪轻重的量化分析》，载《中国社会科学》2003年第6期。笔者多年来也围绕刑事诉讼运行与司法改革进行了多项实证研究，参见左卫民：《地方法院庭审实质化改革实证研究》，载《中国社会科学》2018年第6期；左卫民、张潋瀚：《刑事辩护率：差异化及其经济因素分析——基于四川省2015—2016年一审判决书的分析》，载《法学研究》2019年第3期，等文。而在域外，例如在美国法学界，实证研究已经成为主流研究范式。基于长期实证研究训练得以成就的统计分析能力，又成为与人工智能界跨界合作的关键性助手。于是我们得见域外的司法人工智能产品研发中总是伴随着理论界的身影。例如美国法律人工智能平台Law Geex与斯坦福大学、杜克大学法学院和南加州大学的法学院教授开展合作，设计人工智能程序就四小时审查五项保密协议与20名有经验的人类律师展开竞争，主要考察如何就仲裁、关系保密和赔偿的准确界定问题。康奈尔大学、哈佛大学、斯坦福大学等高校的一批学者利用决策树、迭代算法等机器学习算法，分析了美国法院15万余份重罪案件的承办法官所做的保释或假释决定，研究美国法官在给予嫌疑人保释或假释决定时究竟考虑了何种因素。(32)参见左卫民：《关于法律人工智能在中国运用前景的若干思考》，载《清华法学》2018年第2期。以上研究均具备一个共通性：对数据的收集、整理与分析、运用，并且都着眼于司法人工智能的某一专门领域，而这恰恰是实证研究的擅长之地。平心而论，中国裁判文书网给广大的中国法律研究者提供了一个研究富矿，然而大多数人却对这片研究的“蓝海”视若无睹，却又希望在司法人工智能的研究中占得一席之地，不得不说有本末倒置之嫌。此外，法学研究紧紧围绕事实认定与法律适用中的智能化发展方向也是拉动司法实践发展和回应司法需求的重要一环。例如，当前如何进一步强化人工智能背景下的证据与证明理论研究就是十分重要的命题。

第五，大力培养既懂法律又懂技术的专门化、复合型人才。针对司法活动核心需求的研发，必须由司法人员以及其他法律从业人员与技术人员的共同、深度合作，而非技术人员不懂需求、司法人员不懂技术的自说自话式合作。但由于既往教育体制的因素，造成多数法律人对于数学、统计学等学科处于一种高度疏离状态，无法与技术人员在技术层面进行充分的对话、沟通，这就造成了在司法人工智能设计中法律人的有限参与，这种参与的有限性也影响了司法人工智能产品效果的发挥。为了弥合这种司法人工智能产品设计生产中的“沟通”难题，一方面当下的团队参与模式当然应该继续推行，因为既擅长人工智能技术 (计算机科学、统计学)又精通法律知识的双栖人才的培养是需要长时间、多投入的坚持，绝非一朝一夕可完成。另一方面，需要逐步提高法律人在司法人工智能产品中的参与度、重要性，根本上的解决之道在于培养法律和技术的复合型人才，这就涉及培养体制层面的变革，需要彻底扭转当前将法学视为纯粹人文社科的旧观念，将交叉学科培养理念引入到法学培养体系当中。已有院校对此展开尝试，例如西南政法大学成立人工智能法学院，清华大学法学院设立计算法学研究生项目。笔者也强调并一直努力践行引进及加强对于数学、统计学、计算机科学等与人工智能密切相关的专业到法学教学培养体系中，通过引入统计学、计算机科学的人才并开设法律大数据、法律人工智能、计算机等相关课程，使得法律人在接触法律之初便能同时培养多学科尤其是数据思维。