《铁路技术管理规程》定量分析研究

2019-06-27 08:21保鲁昆孙玉明
中国铁路 2019年6期
关键词:共词工种规章

保鲁昆,孙玉明

(1. 中国铁道科学研究院集团有限公司 运输及经济研究所,北京 100081;2. 中国铁路总公司 科技与信息化部,北京 100844)

《铁路技术管理规程》(简称《技规》)是国家铁路技术管理的基本规章,对铁路的基本建设、运输生产和安全管理都起着重要作用,其内容包括高速铁路和普速铁路2部分[1]。目前,大多数学者对《技规》的研究和分析主要集中在具体条款的论证[2]、整体宏观分析[3]和技术规章管理[4-5]等方面,缺少采用定量方法对《技规》文本内容进行的研究。近年来,随着统计语言处理技术的快速发展,利用统计语言处理技术揭示文本内容中蕴藏的奥秘,可为重要文件内容的规范提供技术支撑。采用统计语言处理技术,对《技规》普速铁路部分和高速铁路部分文本内容进行定量分析,探究《技规》的语言特点和范式。此外,在对《技规》相关数据资源建立关联的基础上,实现对《技规》条款适应性的定量分析。

1 文本内容定量分析

利用自然语言处理与信息检索共享平台(Natural Language Processing & Information Retrieval Sharing Platform,NLPIR)[6]对《技规》普速铁路部分和高速铁路部分分别进行词频统计和共词分析。由于上述分析的基础是中文分词技术,分词的准确性直接影响分析结果[7]。考虑到NLPIR平台词库是中文通用词库,首先对《技规》进行新词发现,把发现的新词进一步编辑标注后,导入系统词典中,从而提高对《技规》分词的准确度。

通过统计分析,《技规》普速铁路部分正文总字数103 775个,总词数49 564个,去掉重复词后总词数4 166个;高速铁路部分正文总字数106 122个,总词数38 650个,去掉重复词后总词数4 114个,略低于普速铁路部分。下面分别从岗位工种、移动装备、固定设施、严格程度词以及共词现象等方面对《技规》进行对比统计分析。

1.1 岗位工种

对《技规》普速铁路部分和高速铁路部分中涉及岗位工种的词语进行统计,主要岗位工种出现次数对比分析见表1。

表1 《技规》主要岗位工种出现次数对比分析

由表1可知,《技规》普速铁路部分和高速铁路部分排在前3位的岗位工种范围一致,均为“司机”“车站值班员”和“列车调度员”,但普速铁路部分“司机”和“车站值班员”排在第1、2位,而高速铁路部分“列车调度员”和“司机”排在第1、2位,说明《技规》普速铁路部分“司机”和“车站值班员”在行车工作中占主要地位,高速铁路部分“列车调度员”和“司机”占据行车工作的主要地位。从岗位工种出现的次数看,《技规》高速铁路部分前3位岗位工种出现的次数为1 021次,普速铁路部分前3位岗位工种出现次数为357次,高速铁路部分远大于普速铁路部分,说明高速铁路部分条款编写更详细地明确了具体岗位职责流程,更有利于全路统一和现场执行。

1.2 移动装备

对《技规》普速铁路部分和高速铁路部分中涉及移动装备的词语进行统计分析,主要移动装备词语出现次数对比分析见表2。

表2 《技规》主要移动装备词语出现次数对比分析

由表2可知,《技规》普速铁路部分排在前3位的移动装备分别为“机车”“车辆”和“动车组”,高速铁路部分排在前3位的移动装备分别为“动车组”“机车”和“车辆”。前3位范围一致,但普速铁路部分“机车”和“车辆”排在第1、2位,说明《技规》普速铁路部分行车组织的主要移动装备为“机车”和“车辆”;高速铁路部分排在首位的是“动车组”,说明高速铁路部分行车组织的主要移动装备为“动车组”。

此外,《技规》高速铁路部分中各编关于列车运行监控装置的表述不一致,其中正文中单独使用“LKJ”有89处,在三编中均有不同数量的出现;使用“列车运行监控装置”有10处,主要出现在第二编;使用“列车运行监控装置(LKJ)”有5处,主要出现在第一编,该表述有待进行规范统一。《技规》普速铁路部分中关于旅客列车和货物列车的表述不一致,其中使用“旅客列车”有73处,“客车”有65处;使用“货物列车”有52处,“货车”有35处,有待进行规范统一。

1.3 固定设施

对《技规》普速铁路部分和高速铁路部分中涉及固定设施的词语进行统计分析,主要固定设施词语出现次数对比分析见表3。

由表3可知,《技规》普速铁路部分和高速铁路部分排在前3位的固定设施分别为“线路”“信号机”和“道岔”,并且出现次数相近,说明普速铁路部分和高速铁路部分在固定设施应用管理方面基本一致;除前3项以外的固定设施出现次数差异较大,如普速铁路部分“接触网”排在第6位、出现34次,而在高速铁路部分排在第4位、出现70次。

表3 《技规》主要固定设施词语出现次数对比分析

1.4 严格程度词

对《技规》普速铁路部分和高速铁路部分中表示严格程度的词进行统计分析,主要严格程度词出现次数对比分析见表4。

表4 《技规》主要严格程度词出现次数对比分析

由表4可知,《技规》普速铁路部分和高速铁路部分中表示严格程度的词语应用基本一致,在对相关条款要求的表述上使用最多的严格程度词为“应”,占比分别为67%和68%。“应”表示正常情况下均这样做,同时允许在经过相关流程审批后突破相关规定。此外,《技规》中表示严格程度的词大多使用的是正面词,如“应”“必须”“可”,而反面词如“不得”“严禁”等使用相对较少。普速铁路部分正面严格程度词所占比例为91.3%,高速铁路部分所占比例为93.5%。

1.5 共词现象分析

共词是文本中词汇对或名词短语的共现情况,用来反映关键词之间的关联强度,进而确定这些词所代表的学科或领域的研究热点、组成与范式,横向和纵向分析学科领域的发展过程和结构演化[8]。将《技规》普速铁路部分和高速铁路部分作为1个整体进行共词分析,部分结果见表5。

表5 《技规》共词分析部分结果

由表5可知,“CTCS”在《技规》中共出现117次,其后出现“-”的概率为100%,“登记簿”“站细”后出现“》”符号的概率也是100%,说明这些词语或符号在技术规章中必须同时出现,否则说明规章用语不规范。这些共词的发现,揭示了铁路技术规章用语的组成与范式。共词分析结果可应用于编制或修订技术规章时进行文本语言检查,后续可在技术规章辅助审查系统[9]中增加语言的逻辑检查功能。

2 条款适应性定量分析

《技规》条款内容的制定具有其时代背景,随着铁路技术设备升级、运输组织优化、国家相关政策和标准的调整,《技规》在执行过程中经常会出现某些条款不适应运输生产需要的情况,如某些条款无法执行、严重影响作业效率以及涉及某些条款的事故较多等现象。为实现《技规》条款的适应性评判,设计开发《技规》知识管理系统,利用条款适应性评判模型对《技规》条款进行自动评价。

2.1 条款适应性评判模型

从现有数据来看,《技规》条款是否适应现场实际主要表现在条款反馈的问题数量、因为本条款发生的事故数以及交流论坛讨论热度等。通过建立《技规》条款与《技规》问题库、事故案例库以及交流论坛的关联关系,利用统计分析方法对《技规》条款的适应性进行评判。

《技规》条款适应性评判模型包括3个变量:第i条款在一定时期发生的事故数xi1、提出的问题数xi2和论坛讨论该条款的主题数xi3,根据经验对这3个变量分别设置不同的权重∂1、∂2和∂3。为使变量具有可比性,采用消除量纲的方法,把变量参数调整至[0,1]区间,则《技规》第i条款的适应性为:

式中:yi为《技规》第i条款的适应性值;∂1为事故数据权重,∂2为问题数据权重,∂3为交流论坛主题数权重,∂1、∂2、∂3均介于 0~1 间,∂1+∂2+∂3=1;m为所有条款中事故数量最大值;n为所有条款中问题数量最大值;z为所有条款中回帖数量最大值。

2.2 系统设计与开发

2.2.1 系统架构

采用B/S(Brower/Server)结构的开放式系统架构,以当前业界比较流行的开源框架平台作为开发的规范依据,并按业务特点进行界面、业务和数据的分离,设计结构清晰,具有易用性、通用性和良好延展性的知识管理系统,并便于后期维护和功能扩展。知识管理系统包括表示层、控制层、业务逻辑层、数据持久层和基础数据库,各层通过Spring框架技术整合统筹管理。表示层提供工作界面,供用户录入和查询业务数据,进行初步的数据检验,反馈操作结果,上传和下载文档;控制层采用目前流行的Spring MVC框架技术,实现表示层和业务逻辑层的关联及跳转;业务逻辑层接受表示层的请求,具体处理业务数据;数据持久层采用MyBatis、Spring DAO框架,调用数据库接口存贮数据至基础数据库中。

2.2.2 系统原型开发

根据架构设计和《技规》条款适应性评判模型,开发《技规》知识管理系统[10],建立《技规》条文说明、问题库、事故案例库、培训材料和交流论坛等相关数据与《技规》条款的关联关系。系统首页见图1。

图1 《技规》知识管理系统首页

将中国铁路总公司第1版《技规》及其条文说明数据上传系统,随着《技规》问题库和事故案例的累积,《技规》条款适应性评判功能逐渐发挥作用。后续将根据适应性评判结果,通过机器学习和人工干预调整适应性评判模型的相关参数,逐步提高条款适应性评判的准确度,为《技规》学习、培训以及制修订提供辅助决策支持。

3 结束语

通过对中国铁路总公司第1版《技规》进行定量分析,揭示《技规》的语言特点和范式,为今后《技规》的修订和其他技术规章的制修订与审查提供参考。后续将继续扩大中国铁路总公司技术规章研究样本数量,挖掘技术规章文本与规章间更多的隐藏关系。《技规》知识管理系统的设计与开发为《技规》相关领域知识的搜集和管理提供了技术支持,经过一定时间的数据积累,通过大数据分析手段和技术,可提出《技规》宣贯、培训及制修订建议,进一步提高《技规》管理质量和水平。

猜你喜欢
共词工种规章
5G通信技术在特殊工种工作中的应用实践
铁路局基本技术规章编制规范化思考
《联合国海洋法公约》中“一般接受的国际规章”解析
过度限制地方政府规章重复立法之思考
过度限制地方政府规章重复立法之思考
特殊工种,劳动保障当及时“成长”
图书馆与档案馆信息公开研究重点及趋势比较研究
我能按照从事有毒有害特殊工种办理提前退休吗
基于Matlab的共词矩阵构造
浅议特殊工种提前退休政策