周俊山
(中国人民公安大学犯罪学学院,北京 100038)
新中国成立以来,公安学发展迅速。80 年代初,公安学成为二级学科,2011 年正式成为一级学科,2017 年进入世界一流学科建设名单。作为学科建设的基本内容之一,研究方法显得尤为关键,它的革命性突破往往能够引起学科的重大进展,地位不容忽视。作为新兴一级学科,公安学研究方法的发展本就受建设周期短的影响,其一级学科地位受到不少诟病[1]。定量研究是社会科学学科的重要研究方法,对公安学学科的发展有着特殊的作用和价值,本文试论之。
选取2012-2020 年CSSCI(含扩展版)收录的公安学学科论文和《中国人民公安大学学报(社会科学版)》发表的论文作为目标样本,通过检索与筛选研究文献、导出与检查文献题录、编码与分析题录信息的步骤,将编码题录信息导入Stata15.0软件进行分析后可以看出,公安学学科的研究内容多围绕着犯罪、安全和公安工作等三方面,呈现出以下特征:
近年来,定量研究方法在公安学学科中越来越受到重视,在公安学论文中得到一定程度上的应用。
1.定量研究方法在公安学学科中受到重视。定量研究方法在公安学论文中占一定比重。在2012-2020 年,在CSSCI(含扩展版)发表的公安学学科论文总数变化不大,基本保持在每年1000 篇左右,2017 年最多,为1077 篇,其中定量研究论文所占的比重有一定变化,在2016 年最低,为5.62%,2014 年最高,为8.04%(见图1)。这种趋势在公安学学科期刊中更加明显,《中国人民公安大学学报(社会科学版)》定量研究文章所占比重逐年增长,2020 年接近15%(见图2)。这在一定程度上说明定量研究方法在公安学学科中越来越受到重视。
图1 2012-2020 年CSSCI 发表的公安学学科论文数量及定量研究论文所占比重
图2 2012-2020 年《中国人民公安大学学报(社会科学版)》定量研究文章比重
公安院校统计学教材的出版和课程的出现也说明定量研究方法在公安学学科受到了重视:2013 年,中国人民公安大学主编的《公安统计分析》教材出版,这是公安学学科目前为数不多的定量研究方法的教材,该教材介绍了一些基本统计方法,比如数据整理、多元线性回归等,标志着在公安高等教育中开始重视定量研究。南京森林警察学院开设的《公安实用统计学》课程系统介绍了警务数据度量、数据描述、抽样技术、假设检验、实验设计、大数据等定量研究的前沿理论和方法,基本跟上了当前定量研究方法的发展潮流。
2.定量研究的水平也越来越高。在中国,定量研究方法经历了以下发展阶段:第一,初步发展阶段,以抽样调查数据为基础,专业化的数据调查规范得以形成和成熟;第二,稳步提升阶段,引入了反事实分析、(准)自然实验等一系列前沿方法,扩大了定量研究方法的应用范围;第三,大数据阶段,大数据的迅速发展为定量研究方法提供了更大的视野和用武之地。[2]公安学学科的定量研究方法也基本遵循这个路径,研究方法也越来越科学,从单维到多维、从静态到动态(dynamic modeling)、从单因素到多因素(multivariate)、从单层到多层(multilevel)、从 单向到双向(reciprocal,endogenous);
(1)使用的数据从截面数据、纵向数据到大数据。在公安学学科中,截面数据使用的最多,最近几年纵向数据的比重越来越大,也出现了一些使用大数据的定量研究成果,呈现以下特点:
从单维到多维:截面数据是在同一截面上的数据,时间序列数据是在不同时间上得到的数据,两者都是一维数据,而面板数据是同时在时间和截面上取得的二维数据。严格地讲,面板数据是指对一组个体(如罪犯、警察等)在多个时点连续观察得到的数据,所以也被称为“追踪数据”。近年来,面板数据相对容易获得,应用范围也不断扩大。很多公安学论文使用省级面板数据,进行了一系列研究,如《治乱无需重典:转型期中国刑事政策效果分析》等,产生了一定程度的影响。
从静态到动态:主要体现在横向研究到纵向研究发展,横向研究是公安学学科中最常见的,使用截面数据对公安学相关领域中某一时点的某一现象进行研究,也可以用来分析和比较研究对象不同部分在某一时点的特点及其关系,并且分析及解释原因。纵向研究是使用某一现象不同时间点的资料,用以研究该现象的发展变化,以及分析发展变化的原因。其主要包含时间序列研究(time series studies)、队列研究(cohort studies)、面板研究(panel studies)等三种类型。例如曾鹏、陈嘉浩使用时间序列的VAR 模型,分析了青少年犯罪的影响因素。[3]
而进入大数据时代,抽样调查的数据获取方式逐渐让步。很多研究是通过“网络爬虫”、NUDIST和Ethnograph 等软件收集数据,而在公安学学科中,搜集网络数据进行定量研究也成为一股潮流。如曾子明、万品玉以红黄蓝幼儿园涉嫌虐童事件为例,提取微博词级和句子级特征,分析整条微博的情感。[4]
(2)研究方法从单因素到多因素,从单层次到多层次,从单向到双向。现有的公安学学科的定量研究方法已经从单因素发展到多因素,而在多因素分析的基础上,为了提高研究结果的严谨性,在定量研究方法方面做出了进一步的探索,如多层统计分析模型(multilevel model),将分析方法从一个层次到多个层次,还包括内生性检验、稳健性检验和中介效应检验等,将分析方法从单向发展到双向。
从单因素到多因素。根据解释变量数量的不同,定量研究方法可分为单因素分析(没有解释变量)、双因素分析(只有一个解释变量)和多因素分析(一个以上解释变量)等,而选择它们的主要标准之一是研究目的,社会科学的研究目的主要包括探索、描述和解释等三种,其中以探索为目的的研究使用的是定性研究方法,后两者使用的主要是定量研究方法,并且描述性研究多是单因素分析为主,需要大样本,因为调查数据的难得性,解释性研究越来越多。但是由于变量之间的联系是普遍的,使用单因素和双因素分析,不控制更多的协变量,可能得出不精确甚至错误的结论。因此,现在公安学学科的定量研究方法已经从单因素分析发展到多因素分析,设计复杂、理论性强,可以反映变量间是否存在联系、关联的方向和程度等。
从单层次到多层次(multilevel)。定量研究中常见分析方法都是将不同层次的研究单位视为一个层次,忽视了组间差异,多层统计分析模型能够将不同层次的研究单位结合在一起,同时呈现组间差异和组内差异,又能分析不同组别内个体特征的斜率差异,纠正分析结果可能带来的偏误,[5]该模型是定量研究方法最重要的进展之一。在公安学学科中,由于涉及政府和公民个人,比如犯罪率、公共安全支出等数据是社区、城市等高层次数据,公民相关信息是个人层次数据,这样数据就具有多层次结构,所以多层统计分析模型也在公安学学科中得到重视和应用,定量研究方法也从单层次发展到多层次。
3.新型定量方法在模型分析中得到应用
(1)内生性检验。在公安学学科中,模型分析中存在的内生性问题也在很大程度上受到重视,该问题会导致模型分析结果的不一致甚至错误。被解释变量Y 与解释变量X 之间存在随机误差项,在最小二乘法(OLS)经典假设中,X 与随机误差项之间的相关系数要为0,否则就存在内生性问题,OLS 估计量是非一致的。造成内生性问题的原因很多,但受到关注的主要有遗漏解释变量偏差、变量存在测量误差、被解释变量与解释变量有双向因果关系等三个方面。如公安学学科下的二级学科犯罪学中的经典问题之一,犯罪率与警力之间的关系就是典型的双向因果关系。众多研究者为克服该问题而采用了诸多策略:最初使用截面数据,随即使用纵向数据和自然实验方法,比如工具变量法和双重差分法,这些方法依赖于影响被解释变量的外生扰动,这些扰动由于独立于被解释变量-解释变量关系而造成被解释变量的外生变化;如果研究者能够获得政府支持,采用准自然实验的方法一样可以得到一致性的估计结果。[6]如田铮、丁日佳将电梯责任保险试点视为准自然实验,使用双重差分法分析电梯责任保险对电梯公共安全管理的影响。[7]
(2)稳健性检验。稳健性检验是改变分析模型中的参数设定,观察数据分析结果的符号或显著性有无太大变化,如果没有太大变化,说明分析结果是稳健的。公安学学科从多个角度进行了稳健性检验:变换变量,也就是选用相似变量替代解释变量或被解释变量,在公安学学科中是使用最多的;转换模型,一般选用“姊妹”模型互为检验,比如Logit 和Porbit;在纵向研究中,在模型中加入时间趋势项与时间趋势平方项,重新对被解释变量进行估算;将分析样本分类等方法。如在《农民工犯罪类别的决定因素》一文中,作者将分析样本分为初犯与惯犯等类型进行了稳健性检验。[8]
(3)中介效应检验。公安学学科的目的之一是为了推进公安工作,因此中介效应检验也得到重视和使用。为了验证解释变量对被解释变量的影响途径以及保证解释变量和被解释变量关系的真实性,在分析解释变量X 对被解释变量Y 的影响时,如果X 通过变量M 对Y 产生影响,那么就可以说变量M 属于X 与Y 两者关系的中介变量,是X 对Y 的影响路径之一,进一步证实了X 与Y 两者之间的关系确实存在。中介效应检验方法主要包括逐步检验法、系数乘积检验(Sobel 检验法、Bootstrap 检验法)等几种,其中最科学和使用最广泛的是Bootstrap 检验法。[9]如彭运石等就使用了逐步检验法检验了同伴关系在家庭教养方式与犯罪青少年人格之间的中介作用。[10]
尽管公安学学科的定量研究方法取得很大进步,但是与其他学科相比,使用定量研究方法的论文数量总体较少,研究质量不高:
1.总体上,公安学学科中定量研究方法运用不多。本文搜集的CSSCI(含扩展版)期刊的数据显示,公安学学科使用定量研究方法的论文,在2012-2020 年依旧不到10%(见图1),在《中国人民公安大学学报(社会科学版)》中,使用定量研究方法的论文所占比重尽管逐年增长,但除了2020年以外,其他年份均低于10%(见图2),这远低于国内很多其他一级学科。[11]这说明,绝大部分公安学研究尚停留在理论探讨层面,“不仅造成公安学理论结构与知识结构的欠缺,更严重的是,它使公安学理论更加远离我国的社会政治现实,削弱了公安学的科学功能与社会效应”,[12]也是公安学一级学科地位受到质疑的主要原因之一。
2.定量研究方法质量依旧不高。从定量研究方法的质量上看,公安学学科的定量研究方法水平相对较低,大部分研究为描述性研究,仅停留于表象。从发表在CSSCI(含扩展版)上的文章看,公安学学科的定量研究方法质量较好,但是,即使从《中国人民公安大学学报(社会科学版)》中的定量研究论文看,数据分析技术相对简单,虽然大多数定量研究论文已经使用了多因素分析方法,但是使用的数据多为截面数据,使用内生性检验、稳健性检验或中介效应检验的文章几乎没有,新的定量研究方法应用较少。比如,近年来犯罪学学科出现一种新的方法,利用高频数据解决双向因果关系导致的内生性问题,因为警力会随着犯罪状况的变化而调整,不过这种调整需要隔一段时间之后才能发生,这意味着高频数据能很好解决这种内生性问题,[13]但是国内类似研究几乎没有。不解决可能存在的内生性问题,会导致解释变量与被解释变量存在偏差;稳健性检验没有注意,会降低了分析结果的可信性;中介效应检验被忽略,仅仅分析解释变量对被解释变量的影响,不探索其中的中介机制,提出的政策建议可能会脱离实际,这些问题的存在,都降低了研究结论的说服力。
公安学学科中相关数据缺乏,定量研究方法的自身局限性在公安学学科中被放大,研究范式主要还是来自法学,相关研究与公安实践部门脱节,这些都是公安学学科的定量研究不足的原因。
数据是社会科学研究,特别是定量研究的核心。[14]近年来,公安学学科的数据收集和使用取得了一定进展,但相对于大部分一级学科来说,由于各种原因,能使用的数据无论质量还是数量都严重不足,束缚了定量研究方法的应用。
1.行政机关数据库资源未公开。公安学学科其实并不缺乏数据,公安部门和司法行政部门都能为公安学学科提供非常丰富的数据资源。如公安部门的户籍管理系统和居民身份证查询系统、治安管理数据信息、重点人员管控数据信息与违法犯罪信息、看守所在押人员管理系统、戒毒人员管理信息系统,司法行政部门还拥有监狱服刑人员的详细数据信息,这都是普通的追踪调查也很难做到的数据信息。
这些数据都是多维的,规模大,代表性强,但是一直是服务于部门内部工作,没有向社会公开,只有一些内部在职人员攻读研究生,使用这些数据做了一定程度的定量研究,这些研究成果一经发表或出版就产生了很大影响,[15]这从侧面说明了这些数据的价值;不过,这些数据本身也存在一定不足,如不够详细,收集的变量较少,很难进行深入分析。
2.司法机关数据库资源数据化不强。相对于行政机关,近年来,中国司法机关的数据库建设获得了很大进步。2013 年,最高人民法院建立了中国裁判文书网,将全国法院裁判文书在网络上全部公开。裁判文书网可以被视为一个“隐性”的全国性“犯罪记录数据库”[16],同行政机关数据库相比,犯罪记录更加详细,为公安学研究尤其是犯罪研究提供了数据基础。
但是,裁判文书尤其是刑事裁判文书都是纯文字性资料,数据化不强,并且有滞后性,未破案件也没有纳入,还缺乏直接查询功能,只能整理为比较简单的数据,做深入分析比较困难。
3.公安学学科缺乏全国性抽样调查数据。进入21 世纪以来,国内微观调查数据发展迅速,已经有了很多追踪调查数据库,大部分数据库都能公开使用,常用的微观调查数据库见表1:
但是,公安学学科较少进行各类综合的、专项的抽样调查,研究者所能获取的统计数据资料非常有限,所以运用定量研究方法最多的是来自实践部门的研究者;很多研究使用表1 中调查数据库中公安相关数据,但是这些数据并不是专门公安调查,往往数量较少并且没有细化,很难进行深入的系统分析。
表1 常用中国微观调查数据库
公安学学科缺乏抽样调查数据的一个重要原因是,尽管定量研究方法有很多长处,但不可否认,该方法也存在诸多局限性。定量研究方法依赖于获取、分析、解读、理解经验材料的正确方法和态度,但是由于公安学学科研究对象的特殊性,该方法的高要求在公安学学科中很难得到满足。
公安学学科研究的样本不充足,抽样成本高。定量研究方法是建立在观察和测量社会现象重复发生率的基础上,通过观察大量样本中的众多变量,依据大数定律做出推论,最终获得一般规律。但是公安学学科的一部分研究对象,比如犯罪是一种极端的反社会行为,并不是普遍存在的,很难界定抽样框;而公安工作具有很强的专业性,普通公民为调查对象的话,不一定了解公安工作,对公安工作做出准确评价更不可能,造成预设的非充分满足性,调查结果缺乏效度,但是公安工作又离不开群众;因此,公安学学科的研究样本并不像其他学科那样充足,抽样调查的成本会更高。现有公安学研究中,研究者和研究机构的调查范围都较小,多数调查仅仅是数个监狱,很难保证随机性,代表性和分析结果的置信度就大打折扣。更为糟糕的是,与其他研究不同,公安学学科中的犯罪研究存在很大的“犯罪黑数”问题,即使是大规模随机抽样调查,也很难得到真实的犯罪水平,分析结果可能存在“幸存者偏差”,这一直是困扰该研究的主要问题之一。
“价值中立”原则和伦理原则在公安学学科中更难遵守。定量研究方法要求以“价值中立”原则为指导,做到研究的客观性,但是在社会科学研究中,受价值偏好、人文关怀、人情世故等主观因素的影响,价值中立很难遵守。在中国,公安工作是人民民主专政政权工作的重要组成部分,是依据党和国家的政策、法律及公安法规保卫国家安全与社会治安秩序的专门工作,具有强烈的阶级意识和价值偏好。公安学调查中也很难遵守伦理原则。一般来说,社会调查要遵守两个重要伦理原则:自愿行为和对研究对象无害,即应该尊重被调查者的意愿,并保护其利益。[17]但一部分公安学调查很难做到,比如犯罪问题调查,涉及被调查罪犯的切身利益,很难做到对其无害,被调查罪犯的自愿行为也会大打折扣,这种情况下,数据的信度和效度会很差,最终会干扰研究结果。
从2011 年到现在,公安学学科还没有形成自己的研究范式。2011 年以前,公安学是法学下的二级学科,其研究范式深受法学的影响,而目前中国法学学科中使用定量研究方法的计量法学(Jurimetrics)还处于初期发展阶段,[18]使用的定量研究方法只是局限在某一种或者几种传统统计和计量方法上,“对局部裁判文书的手工统计是目前最为流行的方式”,[19]即使如此还只有少数学者尝试,这也是定量研究方法在公安学学科中不受重视的原因之一。
但是,公安学学科在研究对象、研究宗旨等方面与法学学科存在很大不同:[20]第一,研究对象不同。研究对象决定了学科研究方法的性质,因而也决定了学科的方法论及研究范式。[21]法学的研究对象是法律现象及其规律,而公安学只研究公安工作所涉及的法律及其实施情况,研究如何以警察手段维护国家安全和社会治安秩序,评估相关公安政策贯彻实施的状况及存在问题,这些都需要收集数据和定量研究方法回答。第二,研究宗旨不同。法学的研究宗旨在于研究法律本身及在司法实践中存在的问题,及时总结经验和教训,为司法活动提供合理建议和科学依据,推动法治建设。在司法实践中,认定的事实必须是确定性事实,不存在概率上的论证方式,这在一定程度上压缩甚至排除了定量研究方法的适用空间。公安学的研究宗旨是及时准确地总结公安工作的经验教训,形成科学的公安对策,有效地服务于公安实践,最终有效地维护国家安全和社会秩序。定量研究方法能够通过收集和分析数据能够更好地概括和总结公安工作的经验及教训。所以公安学与法学在研究方法上有着本质的区别,公安学学科更需要定量研究方法,这也是公安学学科能够从法学中脱颖而出,成为一级学科的重要原因。
尽管在中国法学学科中,定量研究方法没有受到重视,但是20 世纪以来,在西方发达国家的法学学科中定量研究方法日益受到青睐。[22]所以,无论法学还是公安学,定量研究方法都应该得到应用和推广。
国际上,理论问题和实践问题共同构成了警察科学有效的方法论结构,警察科学的发展是由国家内部安全面临的问题和挑战决定的,持续变革是警察科学制度化的问题之一,学术界与警察实践的协调需要内部沟通和实际应用,也需要方法论;[23]而大多数一线警务人员都在努力使用循证警务模式(Evidence-based Policing),也就是说,他们希望尽可能使用最具选择性的警务技巧,这个答案来自研究和分析。[24]在中国,实战性是公安学学科的重要指向。近年来,中国公安机关陆续推行了上百项全面深化公安改革的重大举措,尤其是在当今大数据、人工智能和云计算的信息时代,公安人才具备的知识素养是全方位和多元的,这些公安改革创新和技术成果亟须理论指导、总结和提升,进一步突出了循证警务模式的重要性。
而要建立符合国情和警情的循证警务模式,必须有各类研究的长期积累,尤其是一手数据的支撑,否则,循证警务只能是“无根之木”。但是,并不夸张地说,即使在全世界,大多数警察机关对警察科学没有兴趣。欧洲警察学院(CEPOL)对欧洲警察机构的一项研究发现,在30 个国家中,只有5个国家的警察科学显示出“高”价值;相比之下,在近一半的国家,警察科学被认为是低价值的。CEPOL 的研究通过两个特点对低价值进行分类:警察对研究和培训的需求很少或根本没有,少有的培训业没有参考科学或学术知识。[25]在大多数警察机构中,在实现犯罪分析与日常警务工作的融合方面仍然存在问题,大学科研人员对警务中的犯罪分析工作的参与程度仍然较低。在中国也是如此,目前公安学研究脱离公安一线实际和公安机关经验总结缺乏理性提升的现象同时存在,[26]在CSSCI(含扩展版)发表的公安学学科定量研究文章中,公安工作方面的仅仅占18.38%,不到1/5,一个重要原因是掌握数据的一线民警对定量研究方法不了解,而掌握定量研究方法的研究人员又没有一手数据,所以,对中国公安工作研究多局限于工作总结和经验表述的层次上,深层次研究不多。[27]民警依旧是以经验警务模式开展工作,可能造成两种后果:一是优秀的经验方法得不到认同和推广;二是工作效果不佳,甚至产生反作用。
鉴于公安学学科中定量研究方法的发展现状和前景,为了进一步提高公安学研究的质量,更好地为公安实践服务,本文建议多方面在公安学学科推动定量研究方法的应用和发展。
研究方法是科研和教学融合的枢纽。学科建设的主要任务包括提升科研水平、培养创新人才以及推动两者融合。公安学学科是服务于公安部门,而公安人才的前提是具备专门化的知识和技能,这些取决于公安院校学生是否具备深厚的专门知识和技能。
所以在公安院校课程设计中,要加大定量研究方法课程的比重,在必修课、专业选修课和公共选修课等三个层次中培养学生的定量研究能力:必修课加大《高等数学》课程的开设,同时发展公安特色的统计学,翻译和编纂国外经典公安统计学教材,并结合中国公安实践编辑出版适合中国国情的公安统计学教材;专业基础课为《社会调查研究方法》或《公安学研究方法》,可以根据不同的二级学科,开设SPSS、Stata、SAS、R 语言等统计分析软件;公共选修课则可以开设NUDIST 和Ethnograph 等大数据软件,学生根据专业方向需求、职业规划、兴趣和爱好进行选修。
为了推动警察科学的发展,国外研究者一直呼吁,大学必须成为警察机构的重要合作伙伴。医院与大学结合的模式受到推崇,在英国,许多大学都与警察建立了伙伴关系,如国家情报模式。[28]
相比国外,中国公安学学科具有得天独厚的体制优势和人力资源优势。全国一共有35 所公安院校,这些公安院校的教师属于警察技术编制,与公安机关有着天然的紧密联系,应该进一步在数据收集、整理、分析和应用等方面加大合作;也可以通过在职民警培训和警务硕士等渠道传播定量研究方法,提高一线民警的数据分析能力。
习近平总书记强调,要推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国。因此,面对定量研究方法在公安学学科中的发展状况,建立犯罪抽样调查数据库乃是当务之急。建立一个比较全面的全国性犯罪数据库,为定量研究提供数据支持,进一步保证研究成果的科学性和严谨性,为公安工作提供强而有力的支撑,这是贯彻落实全国公安工作会议精神的重要举措,也是履行新时代科技强警发展战略职责任务的具体实践。
建议在全国建立一定数量的犯罪监测点,对犯罪进行监测、追踪和分析,以系统性、持续性开展犯罪人员、犯罪类型及犯罪手段等方面的感知、建模、预警、预测、预防及综合治理策略研究,主要采集以下内容:犯罪案发数量、犯罪特征、罪犯的个人、家庭特征以及作案方式、公安机关的侦破情况、检察院的起诉情况、法院的判定情况等。参照《中华人民共和国数据安全法》等相关法律,使用特殊申请的方式,严格管控数据使用,推动定量研究方法在公安学学科中的发展,更好地为公安工作服务。