○欧阳国亮
毒品犯罪隐语语料库建设三论
○欧阳国亮
俗语云:有毒品买卖,就有隐语存在。这句话客观上揭示了隐语同毒品违法犯罪之间的关系。近年来,毒品犯罪隐语广泛出现在了互联网、短信、QQ、微信等媒介中,使涉毒活动更加隐蔽。如何应对这一新态势,值得广大禁毒工作者深入探索。我们认为,在新形势下建立毒品犯罪隐语语料库是一条值得尝试的路子。毒品犯罪隐语语料库,简言之,就是在收集整理各地毒品犯罪隐语的基础上,运用海量信息处理技术整合而成的一个大型隐语语料库,它具有三大基本功能:检索(如按音序、义序、地域)、监测、更新。
借鉴国外经验的需要。将毒品犯罪隐语编成专门的词典或整合为语料库,对情报收集及内容破译具有重要意义。在这一方面,英国、德国等国已有尝试并取得了良好效果。例如2009年英国建立了《毒品犯罪隐语档案》,提供给警察参阅,在多起涉毒案件的侦查侦破中都发挥了重要作用,为打击涉毒活动提供了重要的信息与情报支撑。而我国目前尚未在这一领域进行系统化的应用研究,因此很有必要借鉴国外的经验做法开展符合我国国情的研究。
1.革新现有方式的需要。目前,我国对毒品犯罪隐语的整理主要是书面化整理,即:收集毒品犯罪隐语语料,然后分别解释每条隐语的含义等。这种书面化的材料有其不足:一是检索查询不够方便;二是如果某个词条释义有误,无法及时进行修改更正;三是许多毒品犯罪隐语的含义是在不断变化的(毒品违法犯罪分子常常更换暗语),如果发生了这些变化往往需要重新修订,实效性不强。建立毒品犯罪隐语语料库能够很好地解决这些问题,它能够很方便地进行检索,并且能够根据工作的需要随时保持词条的更新,具有较强的时效性和可操作性。
2.整合现有资源的需要。目前国内许多公安机关、检查机关及海关等部门都收集有毒品犯罪隐语,但这些隐语往往都是内部资料,不轻易给其他部门分享,而且还比较零散,这限制了毒品犯罪隐语应用价值的发挥。而建立毒品犯罪隐语语料库的目标就是整合目前国内收集到的此类隐语,构建一个没有地域屏障的毒品犯罪隐语“仓库”并实现共享,最大限度地发挥该语料库在服务禁毒工作中的潜能。
3.适应研究理念的需要。语料库理论主张利用海量数据对纷繁复杂的现象做全局性研究,进而发掘其内在规律和运作机制。用这种方法来整理毒品犯罪隐语,不仅有助于分析毒品犯罪隐语的语义指代关系,而且还可以基于大量语言事实与统计数据推演毒品犯罪隐语的构词规律和形成规则,进而为破译它们提供理论依据和方法支撑。这在公安技术逐渐信息化的今天,无疑具有现实意义。
1.精标注原则。精标注,就是对每一条隐语的指代内容、出现地区、使用群体差异甚至形成理据进行详细的标注。例如同一条毒品犯罪隐语,其内容可能包含两个以上的义项,有的义项可能存在地区间的差异以及使用群体上的差异,这些都需要精细标明。以“猪肉”“一个”为例,“猪肉”一般指冰毒,但个别地区既可以指冰毒,还可以指海洛因;“一个”是表示计量的隐语,在贩毒者口中指1000克毒品,在吸毒者口中往往指1克毒品。这些具有地区性和群体性差异的隐语,如果不遵循精标注的原则,很可能会漏掉一些义项,导致语义上的误解。
2.动态监控原则。动态监控原则是就毒品犯罪隐语语料库库容而言的,指语料库必须是开放式的,能够将新出现的隐语或者原有隐语新出现的一些信息(如义项)及时地纳入到语料库中。如果缺乏动态监控,构建起来的语料库就成了无源之水,从而变成“死库”。因此,动态监控原则要求构建的毒品犯罪隐语语料库不仅仅关注新隐语的出现,而且还要关注语料库中隐语含义、使用范围、使用者的变化情况,做好语料数据的更新与管理,使其始终保持时效性。
3.应用共享原则。构建毒品犯罪隐语语料库的最终目的是为某些涉毒案件的侦查提供隐语检索帮助。因此,构建这样一个语料库应遵循应用共享的原则,使语料库不仅仅局限于某个人、某个单位内部使用,而是将其推向整个公安业务系统,实现信息共享。在具体的操作方式上,可以探索将构建好的“毒品犯罪隐语语料库”置于公安网,也可以研发单机版检索系统在电脑上使用。
1.注重收集整理,积累原始材料。毒品犯罪隐语具有很强的地域性,不同地方的毒品违法犯罪分子使用的隐语不尽相同。各地禁毒部门应当注重收集当地的毒品犯罪隐语,给每条隐语标明出现的地区、指代的内容等信息,做成基础数据表,为毒品犯罪隐语语料库的建立累积原始材料。
2.加强地方合作,实现信息共享。地方禁毒部门要在毒品犯罪隐语资料方面加强合作交流,将整理的毒品犯罪隐语根据“去伪存真、去粗存精”的原则进行必要筛选,实现各地成果共享,使不同地区间的毒品犯罪隐语汇集成一个大“仓库”,为毒品犯罪隐语语料库的建立奠定语料基础。
3.加大相关投入,促进成果转化。毒品犯罪隐语语料库建设是公安技术信息化的重要体现,公安部门应加大对这一领域的投入,在科研立项、技术帮扶、经费保障等方面予以必要的支持。同时鼓励相关人员就毒品犯罪隐语整理研究、语料库开发等方面加强同科研院所、机构的协作,促进技术成果的转化,使之更有效地为禁毒工作服务。
参考文献:
[1]欧阳国亮.中国当代毒品犯罪隐语研究[M].群众出版社,2015.
[2]欧阳国亮.近年来涉毒隐语的新特点及识别思路[J].中国刑警学院学报,2015,(1).
[3]陈曼,欧阳国亮.论数字谐音式犯罪隐语的特点及谐音规律[J].现代语文,2015,(8).
(欧阳国亮 辽宁沈阳 中国刑警学院文件检验技术系 110035)
基金项目:(本文系中国刑警学院科学研究一般项目[2014];辽宁省教育厅人文社科研究一般项目[W2015395]。)