严 安,范晓峰,费 嵩
(中国铁路南宁局集团有限公司信息技术所,1.高级工程师。2、3.工程师,广西 南宁 530029)
史志资料收集作为铁路史志管理工作中极为重要的基础性工作。长期以来,由于资料在收集任务下达、审核、采编、报送等环节多为纸质和电子邮件方式,致使资料收集过程耗时长、手续繁琐、整理困难。同时,由于没有信息化平台,大量史志资料和已出版志鉴书籍得不到有效利用,修志工作成果不能有效服务于企业。研发铁路史志工作综合应用管理平台的计划正是在这样的背景下应运而生,目的在于实现史志资源数字化,志鉴资料采编、考核等工作网络化,为铁路干部职工提供详实的史志资源数字化查询服务,为各级领导决策参考发挥作用。
铁路史志工作综合应用管理平台运行在南宁局集团公司办公信息网上,采用“浏览器/服务器”模式(即B/S 模式)构建,以史志资料收集、资源数字建库、信息展示和查询服务为重点,功能上设置包括志鉴管理、工作考核、资料管理、照片库、信息发布、电子书籍管理、组织结构管理、权限管理等功能模块。
2.1 铁路修志工作信息化流程设计铁路史志工作综合应用管理平台的目标之一是要实现铁路修志工作信息化、流程化管理[1],形成集史志机构资料报送任务下达,到各承修部门、单位收到任务提醒,根据任务说明提报志鉴材料,以及史志机构资料审核、未达要求资料退回重新提报、审核通过入库、资料共享于一体的闭环管理体系。为实现上述目标,在重点梳理修志工作处理流程(见图1)的基础上,平台合理设计了志鉴上报审核流程及数据接口,确保志鉴资料完整、无误地入库。
平台通过上述设计旨在达到史志资料电子化和史志工作网络化、流程化、系统化管理,实现史志数据集中存储、统一管理和信息共享,规范史志资料管理,提高工作质量和效率。
2.2 史志资料数字化管理和在线浏览将几百页的纸质资料转换成电子文档(PDF 格式),利用PDF中间软件提供的API 接口进行编程,实现对PDF 文档的目录和内容分别进行抽取、字符识别、编码转换后[2],完成入库共享利用,并对已入库的史志资料可以进行上架、下架、编辑、删除、还原等管理操作。
此外,管理平台还能增强用户阅读体验,如为解决史志资料通常存在大量图片导致生成的PDF 文件超过500 M 而很难在线浏览阅读问题,开发了SWF 转换组件,即PDF 入库的同时后台逐页将其转换成SWF,用户利用浏览器自带的SWF 插件即可进行浏览。又如采用前台响应式开发,bootstrap 框架布局,通过CSS3中的MediaQuery可以更加精确的作用于不同的媒介类型和同一媒介的不同条件,能够自适应不同的浏览器和设备,达到最佳浏览效果。
2.3 史志大数据资源的全文检索利用中文分词、Lucene 全文检索、索引原理开发检索模块。在Lucene 中,采集数据(从网站爬取或连接数据库)是为了创建索引[3],创建索引需要先将采集的原始数据加工为文档,再由文档分词产生索引。文档包含若干个Field 域。IndexWriter 是索引过程的核心组件,通过IndexWriter 可以创建新索引、更新索引、删除索引操作。在对文档中的内容索引之前需要使用分词器进行分词,分词的主要过程就是分词、过滤两步。过滤包括去除标点符号、去除停用词(的、是、a、an、the等)、大写转小写、词的形还原(复数形式转成单数形参、过去式转成现在式等)。
全文检索就是将查询的目标文档中的词提取出来,组成索引,通过查询索引达到快速、精确搜索目标文档的目的。PDF 文档的全文检索,通过系统定时调度,对PDF 抽取出来的文字内容建设索引[4],实现快速检索,并可以实现直接跳转到包含关键字的所有内容页进行查看。
管理平台自2018 年在南宁局集团公司投入使用以来,覆盖了集团公司33 个机关部门、80 个所属单位,效果达到设计预期。
3.1 大幅提高了修志工作效率管理平台使集团公司修志工作从史志机构的资料收集任务下达,到各部门、单位的资料提报,包括资料收集、审核、采编、考核,资料入库和利用等工作都能便捷完成。集团公司史志办原10 个工作日的资料收集流程缩短到3个工作日内即可完成。
3.2 实现了史志资料的高度共享管理平台全面支持史志资料PDF 格式入库,与史志报送工作形成的史志资料、照片资源实现整合建库,强化铁路各部门、单位史志资料有效管理,形成修志资源全局共享模式。截至2019 年,平台史志资源库已涵盖了近1000 万字的史志数据共享资源,为铁路智库建设提供了强大的数据支撑。
3.3 提供海量史志资料的快速检索管理平台可将大量沉积在史志机构图书资料室的珍贵史志资料和已出版志鉴书籍转化成PDF 在线文档,通过系统定时调度,对PDF 抽取出来的文字内容建设索引,从而实现PDF 文档的快速全文检索,让海量史志资源得到充分挖掘利用,有效发挥史志工作资政、存史、教化、服务作用。
铁路史志工作综合应用管理平台的建立和运用,使史志资料季、年和专项任务提报工作通过管理平台得以规范开展,对提升铁路修志工作效率和信息服务水平作用显著。随着史志资料的持续录入和补充,平台必将在服务铁路史志编修和领导决策、企业文化建设等工作中发挥更大作用。