朱丹浩,纪蔚蔚
(江苏警官学院,江苏 南京 210031)
国内公安学科研究内容分析
——基于(1998—2013)论文关键词的研究
朱丹浩,纪蔚蔚
(江苏警官学院,江苏 南京 210031)
基于 (1998—2013)公安学科的论文关键词,运用文献计量学的词频分析法对公安学科15年来的主要研究内容、研究方法和研究热点进行统计分析,并使用共词分析法构建关键词相关距离矩阵,对频次≥10的2 687个关键词进行聚类分析,得到7个主要聚类。根据以上计算结果,对公安学科的学术规范、政治和社会敏感性、研究范式等多方面进行研究和探讨。
公安学科;内容分析;共词分析法;K-medoids
2011年,经国务院学位委员会和教育部批准,法学和工学门类下增列公安学(0306)和公安技术(0838)两个一级学科,开启了公安高等教育领域的新纪元。诸多研究者从公安学的历史渊源,社会经济发展的变革,党和国家的使命等方面,对学科本身的性质、研究范畴、主要研究方法、学科的内涵和外延进行了高屋建瓴的分析。作为独立的一级社会学科,公安学应具备三个要素:独立的研究任务和研究对象,较成熟的二级学科体系和独自的研究方法,同时在理论基础、学科内涵上和相近学科合而不同。[1]李健和认为,公安学的研究对象是国家安全、社会公共安全及其维护,涉及国家政治稳定、社会稳定、社会治安秩序及其危害因素,以及公安警务工作的历史与现状、公安队伍建设及发展等。[2]中国人民公安大学牵头成立的公安学临时学科评议组提交了公安学二级学科目录的基本框架,即公安学一级学科包括公安学基础理论、公安管理学、治安学等11个二级学科。[3]但这并不意味着公安学科及其二级学科已经成熟和完善,吴跃章指出,公安学一级学科下的二级学科体系有不同的学科组织、制度、传统和文化,各二级学科会随着科学研究的不断深入而不断分化。[4]
为了进一步厘清公安学发展的历史脉络,探寻学科内的热点研究内容、主要研究方法,找出学科内的概念之间的内在联系,本文基于公安学期刊论文关键词,使用统计学、共词聚类等定量和定性相结合的方法展开研究。学术论文是学科发展、学术研究的主要成果和外在表现形式,关键词是对论文实质内容的提取。学科期刊的所有论文关键词,覆盖了该学科的研究范围、研究方法、学科内涵和外延等各个方面。把握了公安学科的论文关键词,也就把握了公安学科发展的历史和现实,在提出公安学科的建设策略和方针时有章可循,有据可依。
本文所使用的数据库为CNKI(中国知网)期刊全文数据库。利用网络爬虫技术,研究者抓取了公安学科36种期刊①(表1)1985年—2013年所有的文献数据,包括文章名称、作者、作者机构、摘要、资助基金、DOI号、下载次数和所属的卷期信息,建立了公安学科期刊论文数据库,数据库中共有论文97 218篇。
表1 公安期刊目录
表2 公安学科高频关键词
相当比例的公安学科的论文没有标注关键词和撰写摘要,CNKI对于这些文献进行了机器自动标注,经过抽样调查,笔者发现如果论文的关键词数目≥9,该论文一般不存在作者标注的关键词。机标关键词依赖数据库提供商的算法,具有严重的主观偏向性(Bias),因此在数据处理中不纳入处理范围。经过统计,56 915篇论文具有作者标注的关键词,占公安学科论文总数的58.54%,这也说明公安学科的论文学术规范性水平整体偏低。对“十五”以来的公安学论文(2001年—2013年)关键词进行统计,得到关键词171 108频次,不重复的关键词58 229个。表1以年份为区间列出了学科内排名前20的高频关键词。
由表2可见,公安学科关键词对学科本身具有强烈的表征特点,频次最高的5个关键词中,除了“对策”,其他关键词均直接包含“公安”和“警察”两个词。公安学科研究的主要内容与公安工作及其核心业务(侦查、社区警务等)相一致;公安学科以自身组织机构(警察、公安机关、公安院校)的研究成为重点;公安学科研究对象突出体现在对犯罪问题和群体性事件两方面;公安学科论文对社会热点和政治热点问题,在一定程度上有所跟进,如2001年—2003年的“WTO”,2004年—2009年的“和谐社会”,2010年—2013年的“社会管理创新”。但从总体上来看,公安学核心热点概念的变动并不明显,2004年—2006年与2001年—2003年相比,频次排前20的关键词重复17个,占总数的85%;2007年—2009年与2004年—2006年相比,频次排前20的关键词重复18个,占总数的90%;2010年—2013年与2007年—2009年相比,频次排前20的关键词重复15个,占总数的75%。热点关键词的变动速度较慢,说明公安学研究创新能力不足,还不能适应我国经济社会飞速发展的需要;公安学研究的宗旨在于有效地为公安工作的实践服务,这一点从热点关键词中也有明显体现;“对策”、“公安工作”、“现状”、“原因”、“特点”等词表明,公安学科研究的主要逻辑链条为“发现问题”、“分析问题”、“提出对策”和“解决问题”。
值得一提的是,增强公安学科期刊论文关键词的学术规范性是公安学科建设中亟待解决的重要问题。首先,关键词本身具有检索功能,决定了无检索意义的词语不能作为关键词。[5]因此,如“对策”、“问题”、“特点”等词不应作为关键词。其次,词性不当。关键词应选用名词或者动名词,不能用形容词以及无实际检索意义的量词、介词、连词、代词、感叹词等。[6]如“完善”等词不应选为关键词。关键词缺乏检索意义,既不利于研究者获取前人的研究成果,也阻碍了公安学科的发展和知识管理水平。
(一)聚类方法
本研究首先根据共词分析法构建关键词之间的关系矩阵。它的原理主要是两两统计一组关键词在同一篇文献中共同出现的频率,利用包容系数聚类分析等多种统计分析方法,把众多分析对象之间错综复杂的共词网状关系简化为以数值图形直观地表示出来的过程。[7]关键词A与关键词B之间的距离d(A,B)如下式所示:
其中,cross(A,B)表示A、B两词共现频次,freq(A)表示词A出现的总频次。显然,两词之间的距离应在0和1之间。
本研究采用的聚类方法是经典的k-medoids聚类法。在K-medoids算法中,首先选择medoids作为类的中心,然后按照距离中心最近原则将其他对象分配至各类当中。距离越大,则两个对象越远;距离越小,则两个对象越近。假设n个对象要分成m类,那么medoids是分别接近于m个类的中心,并且按照一定的标准使得聚类的质量达到最好的m个对象。如图1所示。
(二)聚类结果和分析
为了保证聚类结果的可理解性和有效性,笔者将聚类对象限定于频次≥10的关键词,聚类类数为20。由于K-Medoids算法计算的聚类依赖随机初始点的选取,每一次的聚类结果并不完全一致,在下面的研究中,选取了标准差中值的实验结果进行分析。大聚类的稳定性很高,并且大聚类在实际环境中出现的概率高,具有重要研究意义。因此,笔者将对聚类中关键词数量较多(大于50)的大类进行分析。表1给出了聚类结果的分布信息。
图1 K-medoids算法流程图
表3 关键词聚类分布信息
从表3中可见,所含关键词数目最大的类包含关键词1 013个,占总数的37.8%,最小的类包含关键词数目14个,占总数的0.5%,这表明学科内研究热点的分布不平均性。组内平均距离根据类中所含关键词数目呈递减趋势,说明类中包含的关键词数目越少,该类在概念上的内聚性越强。需要说明的是,中心词表示该词至该类中所有点的距离较小,但对该类并不一定具备“解释”特性,一类中可能存在多个中心词,表中仅随机列出其中一个。
关键词数目较少的类分析价值较小,并相对更可能包含离群点,本文以50为阈值,对关键词数目大于50的前7个类别进行了分析。表4列出了各类中包含的高频关键词。
表4 聚类高频关键词表
聚类1是“侦查学”类,侦查学是我国公安学科研究体系中的第一类。聚类1所示的19个关键词中,有“诱惑侦查、侦查对策、侦查程序、侦查模式、现场重构、秘密侦查、强制措施”等直接表达侦查学研究核心内容的关键词7个;侦查过程中执法问题成为侦查学研究热点,主要有“法律规制、法律监督、司法审查、隐私权、公正”等;在众多案件侦查中,对盗窃案以及案件的构成要件研究最为突出。聚类1中出现了“公安高校、三个代表”等与侦查学研究内容关系不太紧密的关键词,体现了侦查学下概念的普遍联系性和受宏观政策的指导性。聚类2为“公安工作研究”类。聚类2中的关键词有“公安机关、管理、侦查、刑事侦查、治安管理、群体性事件、流动人口、处置”等,涉及公安工作诸多方面的内容,聚类2中的关键词“对策、特点、问题、原因、现状”等反映了公安工作主要研究的主要模式,主体是“公安机关”,通过对其各个方面工作中发现“问题”以及“现状、原因”,接着提出“对策”以应对问题。聚类3是“公安教育”类,“改革”、“思考”和“教学改革”说明全方位改革既是公安教育从事者的诉求,也是学科发展中的必经阶段;“科学发展观”、“素质教育”、“以人为本”是公安教育的指导思想和行动指南;“教学方法”、“教学模式”、“实践教学”、“学科建设”是公安教育过程中的具体操作手段。聚类4是“公安技术和创新”类,体现了公安学科善于从其他学科、法律法规、政策等多种来源引入新的技术和思想,以适应我国社会经济的高速发展的需求。聚类5是“警察法学”类,警察法学的研究范畴以《宪法》、《刑法》、《刑事诉讼法》、《治安管理处罚法》等为主体,这也与公安机关的主要行政管辖范围相互印证,随着时代的发展,网络安全、公共安全、单位犯罪等成为警察法学研究的热点。聚类6为“治安学类”,其中“公安工作、社区警务、和谐社会、社会治安、治安、派出所、警民关系、犯罪预防、警务改革、社会管理创新、综合治理、警务、警察公共关系、社区、警务模式、社会化”等都是治安学研究的主要内容和热点问题;聚类6中出现的“美国”、“比较研究”等关键词表示我国治安学善于学习与借鉴国外先进的社会管理经验。聚类7是“犯罪学”,其中,属于传统犯罪学研究范畴的关键词有犯罪嫌疑人、被害人、证人、取保候审、看守所、犯罪客体控制等,而“农民工、弱势群体”的权利保障问题,以及“突发事件”引发“冲突”及其“法律适用”与“媒体”、“监督”等问题,都向犯罪学研究范畴内聚集并形成焦点。
本文基于(1998-2013)公安学科的论文关键词,对公安学科15年来的主要研究内容和研究方法进行了统计分析。公安学科期刊内发文量和关键词数量逐年上升,至2012年,本文所选的36个期刊载文量已达到历年最高点6 732篇,这说明国家和社会在公安学科中的投入逐年增加,公安学科的研究范围和研究热度也逐年增强。但我们仍应该清醒地意识到,公安学科是年轻的学科,发展中仍存在很多不足和值得改进之处。公安学科关键词对学科本身具有强烈的表征特点,对于时事和政治热点也有一定的反映,但总体上变动并不明显,说明公安学科整体创新能力较弱。总体上来看,公安学科的很多热点关键词本身并不符合学术规范,这限制了公安学科文献的被检索、被索引的质量,从而限制了学科的进一步发展。期刊编辑应该加强对论文的审核,帮助公安研究者加强摘选关键词的能力。
侦查、犯罪、社区警务、群体性事件、公安教育、和谐社会、《刑法》、《刑事诉讼法》等是21世纪以来我国公安学的研究热点。
通过学科关键词的聚类分析,本文发现了公安学科研究的7个主题类——“侦查学”、“公安工作研究”、“公安教育”、“公安技术和创新”、“警察法学”、“治安学”和“犯罪学”,可以为公安学学科建设提供一定的思路和借鉴。
在未来的研究中,研究者将从以下几个方面进一步展开研究。
1.使用基于内容的关键词提取技术,进一步全面发掘公安文献的热点知识和核心概念。
2.探索使用其他聚类方法,如基于密度的聚类方法、层次聚类法等,可以有效控制每一类聚类的数目,增强聚类的可解释性。
3.增加收录的公安期刊数量,建立更为全面、翔实的公安文献题录数据库。
注释:
①鉴于公安学期刊数量繁多,其学术性难以认定,本研究选取的公安学术性期刊为被CSSCI引用的公安期刊,且依被引频次由高到低排序。
[1]王明生.公安学一级学科设置的重要意义及学科体系研究[J].江苏警官学院学报,2012,(1).
[2]李健和.公安学一级学科建设若干思考[J].中国人民公安大学学报(社会科学版),2010,(1).
[3]程琳.以新设公安一级学科为龙头,努力开创公安教育新局面——关于公安一级学科建设与发展的若干思考[J].中国人民公安大学学报(社会科学版),2011,(2).
[4]吴跃章.论公安学二级学科体系构建的基本原则[J].教育论坛,2013,(6).
[5]马妍春,黄可心.科技论文、关键词及参考文献的规范化[J].情报科学,1999,(11).
[7]钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008,(5).
(责任编辑:王佩贤)
D631.15
A
1671-0541(2014)05-0111-06
2014-06-20
朱丹浩(1986-),男,江苏警官学院图书馆助理馆员;纪蔚蔚(1961-),女,江苏警官学院科研处高等教育管理研究员。
本文系江苏高校优势学科建设工程资助项目(PAPD)和国家社会科学基金项目《面向微博的舆情波动与扩散趋势预估模型研究》阶段性研究成果,项目编号:13BTQ046。