文◎左卫民*
法律大数据的出现,使得基于法律大数据的司法实践与新型实证研究成为可能,并可能带来法学研究方式的革命性变化。
当前这项研究存在若干误识,如将“大量数据”“结构化数据”等同于大数据。“全样本”是大数据最显著的特征,然而,目前国内的法律大数据基本上只是部分数据,称其为“大量数据”或更合适。相比于商业、社会领域的大数据,法律大数据具有官方性、结构化的的独特性。官方化特征不仅使得法律数据的公开程度受到影响,也影响到法律数据的内容、类型及格式。基于法律机关的政策考虑,向社会公开的法律数据其实是按照司法机关的管理目标所生产的内容,而非有关法律实践的充分、真实数据。真正丰富的法律大数据应由各种法律主体参与生产、制作并发布,具有全样本、即时性、多样化特征。现阶段中国法律大数据实质上只是法律领域中的有限数据,也是角度特定的数据。
并且,大数据法律研究是一项综合性、系统性工程,研究者掌握与运用相关研究方法的能力在很大程度上决定了研究的深度与层次。法律大数据研究的核心在于对海量数据的价值挖掘、处理,这就涉及上述数据的获取、清洗与使用。目前我国在如何使用法律大数据展开研究方面,也存在方法的科学性不足等问题。
未来的大数据法律研究应致力于获取全面、多样的法律数据,探索并深入展开大数据法律研究的科学方式。不仅要思考如何更好地获取法律大数据,还要探讨如何正确认识与适当使用“大量数据”,更要充分利用统计方法展开大数据法律研究,探讨如何科学使用机器学习等新方式分析法律大数据。此外,继续重视对法律“小数据”的挖掘与运用,以及加强复合型研究人才的培养,也同样重要。
(摘自《法学研究》,2018年第4期,第139-150页。)*四川大学法学院教授[610064]