走向“计算法学”:大数据时代法学研究的选择

2017-03-14 21:45钱宁峰
关键词:法学研究者法律

钱宁峰

(江苏省社会科学院 法学研究所,江苏 南京 210013)

走向“计算法学”:大数据时代法学研究的选择

钱宁峰

(江苏省社会科学院 法学研究所,江苏 南京 210013)

当前,法律大数据研究面临着诸多问题:一是静态法律数据多,动态法律数据少;二是法律数据分析多,法律模型分析少;三是法律规范数据多,法律行为数据少。大数据时代法学研究的发展方向是走向基于社会计算的法学,即“计算法学”。这就要求法律大数据研究从以下几方面入手:其一,要关注动态法律数据整合分析;其二,要展开法律社会分析;其三,要开展法律预测分析。这并不意味着传统法学研究无用武之地,毋宁说,传统法学研究将会融合到一种更为高级的法学研究形态之中。

法学;大数据;社会计算;计算法学

随着互联网向社会各领域的渗透,“大数据”已经成为网络时代的新关键词。大数据现象的出现引起了自然科学和人文社会科学的关注和研究。对此,法学亦不例外。一方面,大数据时代的法律问题成为法学研究选题①2013年中国法学会部级法学课题指南明确提到了大数据时代的相关课题,如大数据时代中的“大数据”法律保护体系研究。,进一步影响到法学学科的发展②2014年1月,中国社会科学杂志社和华东政法大学联合发布的“法治中国与司法改革”学术研讨会征稿函所提供的参考选题就有“大数据时代的法学研究新趋势”选题,而从2014年5月31日的学术研讨会议程来看,并无相关论文。不过,已有不少学者关注大数据对法学学科的影响。。另一方面,大数据的运用也成为政法实践关注的对象,并影响到社会综合治理手段的发展。2014年4月22日,中央政法委书记孟建柱在第一期政法领导干部学习贯彻习近平总书记重要讲话精神专题培训班开班式讲话中就提到大数据的运用问题[1]。随着2015年9月5日《国务院关于印发大数据发展行动纲要的通知》(国发[2015]50号)的公布,法律大数据时代在某种意义上已经到来。然而,大数据时代不仅意味着法学研究选题的增加,政法管理手段的变化,更涉及到法学研究的范式转化。伴随着数据科学对传统学科,如社会学、语言学等的影响[2]296-297,法学领域亦出现了探讨大数据对法学研究的意义,如白建军、胡凌、丁春燕等研究者的一些讨论。但是,数据科学对法学的冲击尚未受到法学界的真正重视。一方面,一些法律大数据研究模式未能有效地被探讨,另一方面,法律大数据研究依然被视为传统实证法学研究的延续。这两种倾向均说明深入探讨大数据时代法学研究发展方向的必要性。

一、大数据对法学科研活动的挑战

尽管大数据概念并无普适的界定,但是通常认为大数据具有四个维度,即Volume(超大)、Veloci⁃ty(高速)、Variety(多样)、Value(价值巨大但密度很低)[3]7。大数据现象的出现给科研活动带来了新的挑战,因为科研活动的本质是以数据为中心的研究。作为科研活动重要组成部分之一的法学研究也必须正视大数据所带来的挑战。

在数据数量上,法学研究所处理的法律数据在不断增加。传统法学研究所需要的法学文献资料是非常少的。在涉及某个具体法律问题时,法学研究者在一定程度上可以穷尽相关文献资料。即使在实证研究中,研究者通过社会学方法收集了大量的数据,这些数据仍然在人力所能解决的范围之内。在法律数据库出现之后,法学研究者在法学文献资料的利用方面更为方便,法律数据规模也有大幅度的增加。但是,就某一个时点而言,法学文献资料仍然是有限的。然而,大数据时代海量数据的出现将使法学研究者面临法学文献资料处理的难题,因为这些法学文献资料数量大大超出了以往法学研究者个人阅读能力所能处理的范围。在这种情况下,法学研究者不得不借助计算机来处理相关文献资料。无论是法律法规数量还是法律案件数量,其利用规模越来越大。根据统计,截至2016年2月29日,各级人民法院已经公布生效裁判文书1570.7万余篇,每天新增近4万篇,其中包含维吾尔语、蒙古语、藏语、朝鲜语、哈萨克语5种民族语言的裁判文书,总访问量达4.78亿人次,日均访问量达58万人次[4]57。可以预见,互联网中类似裁判文书的法律数据数量将与日俱增。例如,互联网可能蕴含着大量侦查破案所需要的信息,需要注意互联网用于侦查的资源、工具和方法[5]。虽然海量的法律数据因容易保存利用,给法学研究提供了丰富而便捷的资料来源,但数据爆炸难题也给法学研究带来了沉重的数据负担。这种数据负担并不是任何一个法学研究者所能承受的。

在数据传输速度上,法学研究所处理的法律数据在不断更新。传统法学研究所处理的法学文献资料在一个时间段内处于相对稳定的状态。在某种意义上说,当法学研究者开始研究法律问题时,相关法学文献资料均是过时的法律数据。虽然通过研究以往的法律数据能够了解法律问题的来龙去脉,但是这种法律数据毕竟是“死”数据,无法及时更新。更重要的是,法学研究者在收集、处理数据时往往费时费力,有时必须建立自己熟悉的团队来专门处理法学文献资料。其效率显然难以适应大数据时代对数据处理能力的实时性要求。可以说,法学研究者尚难以做到开展实时法学研究,从而使法学研究与法律实践需求之间存在一定的时间差。

在数据种类上,法学研究所面临的数据呈现多样化态势。传统法学研究者所面临的数据类型较为单一,主要是法学图书、报纸和期刊等载体中的文字信息。伴随着法学文献资料的日益数字化,法学研究数据种类也在开始发生变化,如互联网中的文字信息。但是这些文字信息基本上是结构化数据。然而,大数据时代所处理的数据类型不仅有人工生成的数据,而且有机器生成的数据。这些数据类型包括了文字、图片、音频、视频、表格等,而且常常相互并存。例如,互联网时代所出现的网站、博客、微博、论坛等均出现了大量包含不同数据类型的法律数据。通常来说,法学研究仅仅关注结构性数据,而不关注非结构性数据,因为后者难以纳入法学研究的范围。然而,非结构性数据对于法学研究并不是毫无意义的,如图片和视频可以作为法律证据。这就需要寻找更好的方法来进行处理,否则大量数据始终游离于法学研究之外。此外,即使是结构性数据,由于传统纸质媒体和网络媒体格式的差异,法学研究者要充分利用也必须寻找合适的转换工具。

在数据价值密度上,法学研究面临着数据意义的挖掘课题。传统法学研究者往往关注具有学术意义的法律数据,如司法个案、裁判文书、法律文献。这些数据本身附着的价值较高,而且数据密度也较高。在大数据时代,数据规模巨大,很多单独的数据在研究者看来可能毫无意义,但是如果将大量单独的数据放在一起,寻找出彼此的相关性,那么这种数据就具有巨大的价值。例如,法学研究者常常关注司法者对法律问题的看法,却很少关注司法者个人信息情况。如果能够收集司法人员的个人数据、从事的法律业务等个人数据,那么对法律的理解或许有不同的看法。尽管不少研究通过社会学方法收集了不同群体的法律数据,但是这些数据的样本范围是非常有限的。而在互联网时代,不同群体往往通过网络参与法律过程,从而在网络空间留下了大量数据,这些数据可能密度很低,但是一旦集合形成规模,其显然对社会具有较大的影响。这就需要法学研究者关注这些价值大但密度低的法律数据。显然,法学研究者尚难以展开有效的数据挖掘工作。

正因为如此,法律大数据研究就成为大数据时代法学研究首先面对的课题,否则法学研究将继续固步自封,难以适应时代的发展。

二、当前法学研究的大数据倾向

所谓大数据研究,就是利用大数据技术进行研究。“在科学研究方面,大数据将改变传统的研究方法。通过遥感装置、感应器、计算机收集数据或模拟方法获取的密集型数据,经过计算机软件处理,产生的信息/知识被存储在计算机中,科学家们只需在后台利用数据管理和统计的方法对数据进行处理、分析,获取知识。”[6]对于人文社会科学而言,其意味着出现了开放与全过程研究、碎片化重组研究和计算分析研究三种新的思维[7]。事实上,当前法律领域已经出现了利用大数据进行法学研究的现象。随着法学研究实证化程度的提高,定量分析方法在法学研究中日益流行。法学研究者常常通过社会学方法收集大量数据来进行统计分析,从而赋予法学研究以大数据色彩。这就有必要审视目前法律领域中的大数据研究,以此了解此类研究的发展情况。

(一)当前法律领域中的大数据研究类型

为了便于识别法律领域中的大数据研究类型,这里姑且从海量数据收集和处理这个特征来进行分析。目前,其大致有以下类型:

第一,政法舆情分析。互联网舆情分析是大数据时代数据运用的典型之一,因为“通过互联网传播的信息中包含了网民对当前各种社会现象以及热点问题的立场和观点,涉及政治、经济、军事、娱乐、体育、卫生、科技、个人生活等多个领域。网络舆论最直接、最快速地反映了各个层面的社会舆情状况与发展态势,已成为社会政治、经济、文化等相关重要领域的社会舆情晴雨表,受到国家和各级政府的高度重视”[8]201。随着传统媒体网络化,不少媒体机构纷纷建立相应的舆情分析机构,如人民网舆情监测室[9]。而政法舆情分析显然与法律领域关系密切,最为典型的舆情监测机构是法制网舆情监测中心[10]。根据介绍,法制网舆情监测系统采用分布式采集技术,监测范围涵盖国内外约14000家网站频道(包括新闻资讯、论坛/社区/贴吧、微博、博客、电子报刊、视频等),每天定向抓取信息超过50万条,并通过强大的元搜素引擎灵活定制监测项目,共同形成庞大的舆情信息数据库,为及时、精确发现舆情信息提供可靠的技术保障[11]。在分析框架方面,其不再局限于事件本身的分析,而是关注政法舆情动态发展过程,分析不同群体及其人员对事件的看法,并提供相应的对策建议。以浙江吴英案为例,其分为事件概述、事件回顾、舆情走势、调查数据、舆情聚焦、相关言论、媒体观察和舆情点评[12]84-92。这种通过一定技术采集大量数据进行分析的研究模式显然是传统法学研究所难以企及的。由于法制网主要关注法制类资讯,因此,可以视为较为典型的大数据研究。

第二,法治国情调查。法治国情调查严格意义上来说并不是通过纯粹挖掘互联网数据进行研究,而是通过实地调查等实证方法收集大量数据并结合互联网数据进行研究。在这方面,以中国社会科学院法学研究所法治国情调查研究室为例,该研究室的职能是在理论联系实际的基础上,对法学和法治建设进行实证调查和数量分析,分析中国法治建设的走向;在研究方法上,除了采用定性的分析方法外,重视采用定量的方法,通过调查问卷、实地考察、量化评估、统计分析等社会学研究方法,为法学研究提供第一手的资料和数据[13]。从该研究室的运作模式来看,其类似于专门性的收集和分析数据的组织。以2012年中国政府透明度年度报告为例,其研究模式分为三个方面:一是选择调研对象。2012年,调研组选择59个国务院部门、26个省级政府、43个较大的市的政府,对其实施政府信息公开制度的情况进行调研测评。二是设定指标。调研组建立了国务院部门、省级政府和较大的市的政府信息公开测评指标体系。三是调研方法。在调研过程中,除了采取观察的方法对相关政府网站的栏目和信息进行浏览外,还对有关的信息链接、检索系统、依申请公开平台等的有效性进行了实际验证[14]165-166。其研究步骤几乎为其他研究报告所采用。从该研究室主持出版的年度法治蓝皮书来看,其所收集的互联网信息也是非常丰富的。但是,这种研究模式并不具备大数据研究的特征,因为数据收集和处理仍然主要依托人工来展开,而且数据类型依然是静态数据。

第三,法律数据库分析。随着法学文献资料的数字化发展,法律数据库获得了迅猛发展,如中国知网等综合性数据库中的法律数据、北大法宝等专业性数据库中的法律数据。法学研究者也越来越依赖于数据库所提供的法律数据,不仅通过数据库了解法学动态,而且利用数据库资料进行研究。其中,比较典型的是通过法学作者、法学引文、法学期刊等数据来分析中国法学现状和趋势。通常来说,研究者往往通过南京大学中国社会科学研究评价中心所开发的中文社会科学引文索引(CSSCI)来进行分析。通过该工具,可以从来源文献和被引文献两个方面向研究人员提供相关研究领域的前沿信息和各学科学术研究发展的脉搏,通过不同学科、领域的相关逻辑组配检索,挖掘学科新的生长点,展示实现知识创新的途径[15]。其他涉及法律文献的数据库所提供的研究模式和CSSCI基本相同。由于这种数据库所收录的数据量非常大,因此,其表面上似乎具有大数据研究色彩。但是,数据库所收集的法律数据只是数字化的结构性数据,且数据收录时间与数据产生时间具有相当长的间隔,因此法律数据库虽然拓展了法学研究的资料范围,但是并未从根本上改变传统法学研究模式。

所以,严格意义上来说,政法舆情分析才属于大数据时代法学研究类型。对于任何一个个体法学研究者而言,这种研究模式远远超出了自身的数据处理能力范围。这种现象无疑值得人们深思。

(二)当前法律领域中大数据研究面临的问题

在某种意义上说,法学研究很少关注数据问题研究。即使讨论数据的运用,其数据处理技术也是非常初级的。正如有学者指出:“人文社科的研究者对数据处理采用的方法以描述性统计等初级方法为主,初级方法在法学、社会学、管理学等学科的实证数据研究中占了较大比例。”[16]而大数据虽然给法学研究提供了新的课题,但并没有改变传统法学研究的数据处理方式。这说明当前法律领域中大数据研究面临着诸多问题。

第一,静态法律数据多,动态法律数据少。传统法学研究的对象是静态法律数据。这些数据经过编辑处理从而成为人们所熟知的结构性数据,非常容易被利用。即使在数字化之后,虽然其改变了存储数据的载体,但是仍然属于静态法律数据。而对于动态法律数据,传统法学研究几乎不予关注。尽管在研究过程中常常引用互联网上出现的数据,但是这些数据依然属于静态法律数据。而互联网实时产生的动态法律数据要求关注数据存在的特定时空条件,时刻关注法律数据的演变过程,及时分析人们对法律问题的基本动向。加上动态法律数据往往和其他相关数据相混杂,使人们利用数据增加了新的难度。正因为如此,法学研究者尚难以研究动态法律数据。

第二,法律数据分析多,法律模型分析少。毫无疑问,大数据研究要求通过数据挖掘来发现数据的意义。法律数据分析就成为法学研究的必修课。然而,仅仅通过数据分析并不是法学研究的真正目标,因为学术研究的目标是对社会现象进行可重复性验证研究。这意味着法学研究必须要像自然科学那样开展建模分析工作,即通过数据分析,建立相应的理论模型,以便对法律现象开展深入分析。法学研究不能就数据论数据,而要抽象出相应的理论模型,从而建立起具有科学色彩的学科体系。前述政法舆情分析虽然通过采用和以往社会学研究方法不同的大数据技术,能够及时了解政法动态,但是其研究方式和传统法学研究并无太大的差别。因为法律模型分析意味着需要借助计算科学技术方法,所以也难以为法学研究者所重视。

第三,法律规范数据多,法律行为数据少。传统法学研究是以法律规范为中心而展开的研究,因此法律法规数据和司法案例数据成为法学研究关注的重点。随着法律的社会科学研究的展开,经济学、政治学、社会学、人类学、文化学等学科知识对法学研究日益渗透,形成了诸多交叉性研究方式。但是,法律规范理解的研究方式始终是法学研究的主流。而动态数据在大数据时代地位的日益凸显必然使法律规范数据的地位有所下降,而与动态数据相关的法律行为数据的重要性就更为明显,因为法律行为数据涉及到参与法律过程的所有人。这种法律行为数据虽然可以通过行为法学、法律认知科学等学科的发展而获得,但是这些研究尚处于法学研究的边缘地带。大数据研究恰恰需要法学研究关注法律行为数据,以便通过行为分析来了解法律规范背后社会各类群体的法律行为选择。

三、大数据时代法学研究的发展方向

毫无疑问,目前法律大数据研究难以适应大数据时代的需要。尽管自然科学和人文社会科学对大数据的理解不同,但是大数据对学科的影响是有目共睹的。其中最为关键的是计算方式的革命性变化。“各种迹象表明,继物理计算和生物计算之后,社会计算可能成为科学计算研发的新焦点,并产生新的方向和领域。”[8]1社会计算主要有两个层面:一是从技术层面来说,就是计算机或者更广义信息技术在社会活动中的应用;二是从社会层面来说,就是社会知识或者更具体的人文知识在计算机或信息技术中的使用和嵌入,从而提高社会活动的效益和水平[17]。也有学者提出:“社会计算是一门现代计算技术与社会科学之间的交叉学科,一种以科学技术手段对社会问题进行数量化和实时化分析的技术。这是一个社会行为和计算系统交叉融合而成的研究领域,研究如何利用计算系统帮助人们进行沟通与协作,如何利用计算技术研究社会运行的规律与发展趋势。”[18]社会计算意味着社会科学研究的智能化发展。正是因为如此,2009年,《科学》杂志提出了“计算社会科学”这一名称[19]。事实上,经济学领域已经出现了“计算经济学”[20]105。而社会学领域则于2014年提出了“计算社会学”[21]。事实上,自然科学领域早已出现了“计算物理学”等学科概念[22]。这些以社会计算为中心的新学科实际上集中体现了大数据时代对不同学科的影响。需要注意的是,这种计算社会科学或者计算自然科学,不同于以往计量社会科学或者计量自然科学。因此,尽管法学同其他社会科学不同,但是法学研究要适应大数据时代的发展,必然要关注法学研究的智能化发展。因此,法律大数据研究必然要求法学研究走向社会计算化,从而能够像自然科学那样研究法律现象。

首先,从学科发展来看,社会计算要求法学走向计算化。2009年,十五位学者在《科学》杂志上发表题为《计算社会科学》的文章,指出现代网络生活促使计算社会科学的产生,与传统社会科学通过问卷调查形式获得数据不同,可以借助种种新技术获得长时间的、连续的、大量人群的各种行为和互动的数据,这些数据为研究动态的人际交流、大型社会网络的演化等方面的问题提供了坚实的基础[23]。显然,现代网络生活所产生的数据必然包含大量与法律领域相关的数据,这就要求法学研究关注这些数据,并通过这些数据分析社会领域的法律问题,发现社会运行规律。要实现这一点,法学研究必须走向计算社会科学。笔者以为,从学科发展的需要来看,可以仿照其他学科将运用大数据技术进行法学研究的学科命名为“计算法学”。从历史发展来看,计算法学虽然具有计量法学的一些特征,但是具有本质上的差异。通常认为,“计量法学是指通过收集大样本数据,对具有数量变化关系的法律现象进行计量研究的独立交叉学科”[24]。而计算法学超越了计量法学,在本质上归属于“数据密集型科学”,“这一范式以数据为中心来思考、设计和实施科学研究,科学发现依赖于对海量数据的收集和分析处理”[20]4。只有实现从计量法学向计算法学的发展,法学在大数据时代的空间才会更广阔。

其次,从方法发展来看,社会计算要求法学研究方法走向智能化。正如前述,社会计算本质上是一种计算方法论。这种方法论不同于以往的物理计算方法和生物计算方法。“社会计算不可避免地涉及关于人与社会及其相关人文知识的系统,而相对于有限资源,在本质上,无法对社会计算系统通过独立分析其各部分的行为来确定其整体行为,也不能在大时间和空间范围内预先确定其行为。因此,需采用整体论而不是还原论来研究社会计算问题;可能性而不是确定性,应成为社会计算研究的主要特征。同时,必须考虑将‘主观性的倾向’引入社会计算,正视这方面研究的主观性和心理作用。”[8]7社会计算研究必然既涉及整体又涉及部分;既涉及过去和现在,也关注未来;既涉及客观性,也关注主观性。这种研究方法从方法论上来说既是价值研究,也是实证研究,从而出现了定性和定量综合的研究特征。而目前法学研究方法偏重于价值研究,其重点在于法律解释。即使在法学实证研究中,其数据样本往往有限。需要注意的是,尽管随着数据库技术的发展,实证法学研究所利用的样本量获得了大幅度增加,但是这种增加并没有完全改变法学研究的研究方法。例如,中国裁判文书网公布了大量的裁判文书,对裁判文书的研究将是未来法学实证研究的重点,但是由于这种裁判文书数据的获得并不是社会演变的实时数据,仍然是通过人为取样方式来获取的静态数据。更为重要的是,社会计算方法无论是对法律解释研究还是法律实证研究者来说均是非常陌生的,因为这种计算方式是智能化的计算方式,单纯依赖个人自身力量是难以及时处理的,这就需要通过智能化的社会计算方法来帮助法学研究者。

最后,从素质发展来看,社会计算要求法学研究者素质走向数据化。尽管法学研究本身是以法律规范和法律个案等数据为研究对象,因此数据分析对于法学研究者来说并不陌生。随着法律数据的增加,法学研究者可以借助计算机来完成数据的处理工作。然而,大数据时代海量数据的出现使法学研究者数据分析素质越来越高。要具备数据分析的高素质,就必须要求法学研究者不仅掌握法学知识,而且要掌握自然科学等学科知识。然而,通常来说,法学研究者只熟悉法学文献资料,而且也不具备其他学科的知识背景和技术储备,因为从历史来看,“法学与哲学、经济学、社会学等哲学社会科学的紧密相连,但值得人深思的是,法学在引进新的研究方法上与其他的学科相差很远”[25]。从前述大数据类型来看,大数据时代法学研究者必须要和政府、公司等拥有庞大数量数据的组织互相合作。这种现象在一定程度上改变了法学研究生态。法学研究者不能仅仅依赖于个人力量,即使建立了相应的团队,其团队成员的知识背景也将是丰富多彩的,不能仅仅局限于法学领域,而必须同时具备计算科学、社会学、统计学等相关知识背景。这就要求法学研究者首先是一个优秀的数据分析者,才能适应大数据时代的需要。

四、法律大数据研究的路径选择

要实现法学研究的社会计算化,就必须重新思考当前法律领域的大数据研究。这意味着法学研究必须借助于自然科学方法才能开展大数据研究。可以预见,在未来相当长时间内,传统法学研究仍然难以摆脱原有的数据利用方式。总的来说,大数据时代必然驱使法学走向“计算法学”,充分利用智能化技术来研究法律数据,分析法律问题。从理论界来看,许多学科已经开始将大数据技术纳入学科运用之中。2014年10月25日,清华大学公共管理学院举办“大数据与公共风险治理论坛”[26]。2014年11月18日,由南京邮电大学牵头发起的“中国法律大数据联盟”正式成立,该联盟发起单位包括北京大学法学院、清华大学信息科学与技术国家实验室、工业和信息化部电信研究院知识产权中心、南京邮电大学信息产业发展战略研究院、中国政法大学企业法务管理研究中心、北京邮电大学网络技术研究院、法制网、新华网信息化频道、北京高通律师事务所、北京德和衡律师事务所、亚太网络法律研究中心等多家机构,宗旨是探究法律大数据驱动下的立法研究、法学研究、法律应用和法律服务的升级和转型,共同推动法律大数据在国家立法、司法以及法学研究和法律服务等领域的广泛应用。中国法律大数据联盟将联合不同领域的组织机构和专家学者设立理事会和专家委员会,并联合成立中国法律大数据研究中心,编制《中国法律大数据蓝皮书》、组织法律大数据学术研讨会、构建法律大数据与云服务平台,探究法律大数据在法治国家、法治政府、法治社会一体化建设中的作用[27]。更有学者进一步提出:“法律大数据的研究与应用将成为法学研究的一个创新型领域,必须给予高度关注。”[28]而从实践来看,随着对大数据问题的重视,中央和地方纷纷开展大数据运用。一方面,中央政法部门日益开始强调大数据在政法工作中的作用[29]。2015年5月15日,中央政法委举办全国百万政法干警学习科技新知识讲座,其中,广东结合本省公安工作实践,讲解了提升大数据时代运用先进科技打击犯罪、服务人民群众的探索和成效[30]。另一方面,一些地方开始将互联网运用于政法工作之中,如山东政法部门出现了“互联网+政法”的做法[31]。特别值得注意的是,特定领域大数据运用方式更是不断推出。在司法改革领域,大数据主要运用于案件分析、人案测算、业绩评价、交互评价、推动ADR发展、评价司法改革之中[32]。在政府管理领域,不少地方已经开始建立各种数据平台[33]。在基层治理中,大数据新手段也开始发挥作用[34]。从这些动向来看,大数据已在学科层面得以广泛关注并在实践中得以运用。这就提出了一个问题:法学研究将如何作为?

由于社会计算方法为大多数法学研究者并不熟悉,因此,要保证法律大数据研究顺利展开,就必须寻找合适的研究领域。在某种意义上,法学研究要如实践部门那样收集到全部数据是不可能的。但是伴随着数据开放程度的提高,法学研究将有可能收集到相关数据并开展相关研究。通常认为,计算社会科学是一门理工管文相结合的交叉学科,研究范围广泛,其有三条研究主线:一是研究人,从点到面,从对个人兴趣的分析到社会关系分析,直至社会网络分析;二是研究信息,从对信息内容的解析到话题发现和话题传播;三是研究人和信息的属性,包括倾向性、可信度和影响力[35]。而从美国社会学界已经发表的研究成果来看,其大致包括以下相互关联的五大内容:大数据的获取与分析、质性研究与定量研究的融合、互联网社会实验研究、计算机社会模拟研究和新型社会计算工具的研制与开发[21]。由于国外法律大数据研究更多地包括在社会学领域,因此在某种意义上也可以视为未来法律大数据研究的发展方向。因此,基于社会计算应用领域和当前大数据应用的实践动态,笔者以为,法律大数据研究可以从以下三个方面入手:

其一,要关注动态法律数据整合分析。法学研究必须在关注静态法律数据分析的同时关注动态法律数据。动态法律数据不仅是法律领域的数据,也包括与法律相关的其他数据。随着网络社会的不断发展,动态法律数据在网络中得以保留。例如,人们通过博客、微博、微信等渠道交流对法律问题的看法,在法律活动中使用网络来发表对案件的看法,甚至将法律资料存储在网络空间之中。而随着电子政务的发展,政府网站所公布的法律数据也日益增加。特别是,不少政法单位也纷纷利用社交媒体来发布信息。法学研究要充分挖掘新媒体载体上的法律数据,从而使法律问题的研究更加深入。在这方面,法学研究就必须要了解数据科学,熟练运用数据技术。

其二,要展开法律社会分析。传统法学研究是以法律个案为中心的,因此其所关注的是司法者个体,侧重点在于司法者对法律规范的理解。随着实证研究的展开,司法者的其他数据如司法认知、司法行为等亦纳入了研究框架之中。但此类研究始终停留在个体思维研究范式之上。而法律大数据研究就不仅关注司法者对个案的判决,而且要将个案置于特定的时空条件下来进行分析。更重要的是,其必须关注社会群体的法律认知和行为数据,进而对不同社会群体进行分析。这就需要法学研究不能囿于个案分析,而必须将法律活动视为一个社会系统,深入分析法律社会演变的运行规律。

其三,要开展法律预测分析。传统法学研究的重心是对法律规范的理解,集中体现在通过对法律规范的解释为法律的适用提供理论依据。虽然这种研究能够预测法律适用的可能性。但是其预测功能在法学研究中并不是主要的,而且仅限于司法者作出裁判行为的范围之内。至于法律过程中的参与者(如律师、当事人等)的行为预测相对来说较少,更不用说对法律在社会发展中的作用进行预测。然而,大数据时代由于人们频繁地通过网络进行沟通和互动,使得人们的行为轨迹能够被网络设备所记录。例如,当事人可能会通过网络了解法律,发表对自己案件的看法。又如,律师也常常借助网络了解法律实务情况。在这种情况下,法律数据不仅有法律规范理解的数据,也有法律行为人行动的数据。通过对这些法律数据的综合分析,人们能够更加准确地评估法律事件的发展,从而积极调整自己的行为方向。法律预测功能在大数据时代将发挥更加突出的作用。因此,法律决策模式将发生深刻的变化,其不仅能够预测法律个体的行动逻辑,也能发现法律社会的运行规律。

五、结 语

当然,大数据时代对法学研究所提出的任务是非常复杂的。随着网络社会的进一步发展,法律大数据研究将会更为广泛。法律领域大数据研究的展开意味着大数据时代已经对法学研究产生了一定的影响。但是这种影响从目前来看非常有限。这既有法学本身的原因,更与大数据时代所具备的社会条件和技术条件不成熟有关。正如尤瓦尔·赫拉利2016年4月22日在《人类的崛起与未来》讲演中所指出,21世纪正向着这样一个新的方向走去,我们越来越希望所有的大问题或者说艰难问题的答案,不再来自于人类的感受,而是基于一些来自外部的数据处理系统做出的一些分析[36]。法学研究也有必要考虑大数据时代所带来的深刻影响。一旦社会和技术条件具备,走向基于社会计算的法学研究才真正具有现实的可能性。当然,这并不意味着传统法学研究将毫无用武之地。毋宁说,传统法学研究将会融合到一种更为高级的法学研究形态之中去。

[1]孟建柱:把握大局提升新形势下维护社会和谐稳定的能力[EB/OL].正义网,http://news.jcrb.com/jxsw/201404/t20140423_ 1379040.html,访问日期:2014-07-20.

[2]赵国栋,等.大数据时代的历史机遇:产业变革与数据科学[M].北京:清华大学出版社,2013.

[3]李德伟,顾煜,王海平,徐立.大数据改变世界[M].北京:电子工业出版社,2013.

[4]中国社会科学院法学研究所国家法治指数研究中心法治指数创新工程项目组.中国法院信息化第三方评估报告[M].北京:中国社会科学出版社,2016.

[5]王守宽.互联网信息在侦查中的应用[N].检察日报,2009-04-14.

[6]刘红,胡新和.数据革命:从数到大数据的历史考察[J].自然辩证法通讯,2013(6).

[7]孙建军.大数据时代人文社会科学如何发展[N].光明日报,2014-07-07.

[8]王飞跃,等.社会计算的基本方法与应用[M].杭州:浙江大学出版社,2013.

[9]人民网舆情监测室[EB/0L].人民网,http://yq.people.com.cn/service/index.html,访问日期:2014-08-01.

[10]法制网舆情监测中心介绍[EB/OL].法制网,http://www.legaldaily.com.cn/The_analysis_of_public_opinion/content/2011-09/14/content_2950338.htm?node=33488,访问日期:2014-07-26.

[11]法制网推出政法舆情监测系统免费试用[EB/OL].法制网,http://www.legaldaily.com.cn/The_analysis_of_public_opinion/con⁃tent/2013-03/22/content_4303707.htm?node=42602,访问日期:2014-08-01.

[12]法制网舆情监测中心.政法舆情危机应对实务手册[M].北京:经济管理出版社,2013.

[13]法治国情调研室[EB/OL].中国法学网,http://www.iolaw.org.cn/web/organ/org_guoqing.asp,访问日期:2014-07-27.

[14]李林,田禾.中国法治发展报告No.11(2013)[M].北京:社会科学文献出版社,2013.

[15]“中文社会科学引文索引”(CSSCI)简介[EB/OL].中国社会科学研究评价中心网站,http://cssci.nju.edu.cn/news_show.asp?Articleid=119,访问日期:2014-08-01.

[16]沈婷婷.人文社科领域科学数据使用特征分析——基于《中国社会科学》样本论文的实证研究[J].大学图书馆学报,2015,(3).

[17]王飞跃.社会计算:科学·技术·人文[J].科技与社会,2005(5).

[18]王琳琳,陈云芳,耿路.社会计算:计算的新应用方向[J].淮海工学院学报:自然科学版,2012(2).

[19]David Lazer,Alex(Sandy)Pentland,Lada Adamic,Sinan Aral,Albert Laszlo Barabasi,Devon Brewer,Nicholas Christakis,Noshir Contractor,James Fowler,Myron Gutmann,Tony Jebara,Gary King,Michael Macy,Deb Roy,and Marshall Van Alstyne.Life in the network:the coming age of computational social science[J].Science,2009 February;323(5915):721-723.

[20]CODATA中国全国委员会.大数据时代的科研活动[M].北京:科学出版社,2014.

[21]罗玮,罗教讲.新计算社会学:大数据时代的社会学研究[J].社会学研究,2015(3).

[22]彭芳麟,梁颖.科学计算可视化与计算物理学[J].大学物理,2013(7).

[23]张鉴,孔丽华.《Science》杂志发表关于计算社会科学的文章:Computational Social Science[J].科研信息化技术与应用,2010(2).

[24]屈茂辉.计量法学基本问题四论[J].太平洋学报,2012(1).

[25]朱全景.法学实验论纲[J].比较法研究,2013(4).

[26]我院成功举办“大数据与公共风险治理论坛”[EB/OL].清华大学公共管理学院网站,http://www.sppm.tsinghua.edu.cn/xwzx/lbxw/26efe4894945073401494fdfdfbf0009.html,访问日期:2016-05-18.

[27]南京邮电大学发起成立“中国法律大数据联盟”[EB/OL].中国高校之窗网站,http://www.gx211.com/news/20141121/n3191226201.html,访问日期:2016-05-18.

[28]王春晖.法律大数据研究与应用领域的六大展望[EB/OL].新华网,http://news.xinhuanet.com/info/2016-03/21/c_135207757.htm,访问日期:2016-05-18.

[29]蔡长春.推动信息化和执法办案深度融合大数据为政法工作插上科技翅膀[N].法制日报,2016-01-27.

[30]中央政法委举办全国百万政法干警学习科技新知识讲座[N].法制日报,2016-05-15.

[31]余东明.大数据思维引领政法队伍建设[N].法制日报,2016-01-14.

[32]何帆.不依托大数据决策,司法改革会被“黑”到底[EB/OL].国法网,http://www.cnlawweb.net/business/advice/2015121113843.html,访问日期:2016-04-24.

[33]周畅,等.政府转型迎来大数据时代[J].半月谈,2014(17).

[34]李楠楠.基层治理尝试“大数据”新手段[EB/OL].人民网,http://hn.people.com.cn/n/2014/1217/c368221-23257286.html,访问日期:2014-11-02.

[35]谢方.大数据时代催生计算社会科学[N].中国社会科学报,2012-09-19.

[36]赫拉利.数据宗教可能在下一个时代征服世界|研习社课程实录[EB/OL].搜狐公众平台网站,http://mt.sohu.com/20160423/n445775765.shtml,访问日期:2016-04-25.

(责任编辑 刘 英)

D90

A

1671-511X(2017)01-0043-08

2016-09-22

江苏高校区域法治发展协同创新中心项目阶段性成果。

钱宁峰(1975—),男,江苏常熟人,法学博士、博士后,江苏省社会科学院法学研究所研究员,研究方向:宪法与行政法。

猜你喜欢
法学研究者法律
《南大法学》征稿启事
高等教育中的学生成为研究者及其启示
《南大法学》征稿启事
《南大法学》征稿启事
法律解释与自然法
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
让人死亡的法律
法学
“互助献血”质疑声背后的法律困惑