微信公众号在生产技术标准管理中的应用研究

2020-02-21 11:43戴军卫温耀斌
机电信息 2020年33期
关键词:技术标准数据库微信

戴军卫 温耀斌

(广东电网有限责任公司江门供电局,广东江门529000)

0 引言

随着以5G通信、人工智能、工业互联网、物联网为代表的新型基础设施的快速发展及各种高性能移动智能终端的大规模普及,人们对互联网提出了快捷、便利地获取信息的更高要求。在全新的移动互联网时代,微信在满足大众正常信息交流需求的同时,也为电力系统的管理工作提供了一个全新的服务渠道,随之而来的是在微信基础上的各种技术创新。

1 项目研究背景

目前,电力公司已在应用执行的包括国家法律229件、行政法规600多件、地方性法规7 000多件、电力行业相关法规(DL字头)2 032件,国家、行业及电网公司的技术标准更是不胜枚举。但现在还没有合适的组织或个人对电力工程建设适用的法规及标准进行整理,导致法规及标准的更新及查询工作均费时费力,为公司管理带来了很大的不便。因此,非常有必要研发并建立一套方便实用的电力行业生产技术标准管理系统,提高监理人员的工作效率和管理水平。

2 项目的研究与实施

本项目拟建立一套生产技术标准管理系统,主要由PC管理端、微信公众号移动端、PDF自动转换txt和数据爬取服务端等部分构成。PC管理端主要提供对制度、标准等基础信息的维护和文档上传等功能,计划采用ASP.NET开发框架中的MVC开发模式进行开发。操作系统的服务器端使用Windows Server 2008 R2及以上版本,客户端采用微信WeChat 7.0及以上版本。CPU采用Intel Xeon 2.5 GHz或性能更好的芯片,内存8G及以上,硬盘可用空间20G。软件环境要求IIS7.5及以上、MSSQL Server 2008 R2及以上、Net Framework4.6.1。微信公众号移动端用于查询和浏览制度、标准文档,用户通过搜索关键字,能够快速检索到对应的制度、标准中的相关条款。要完成以上检索功能,系统就必须有服务端的支撑,服务端功能主要工作分为两部分:第一是对PFD进行文本转换;第二是使用爬虫技术定时去目标站点进行数据爬取,并将爬取的数据存储到系统数据库中。本系统架构方案采用分层分布式的部署结构,明确分离了表现层和业务逻辑,能够保证应用服务逻辑的一致性和稳定性、结构的开放性、功能的可扩展性和可维护性、开发的可并行性。

3 项目的功能与运用

3.1 安全便捷的信息管理

生产技术标准管理系统的数据相对敏感和保密,如何有效地保障系统的安全性和数据的安全性,是本平台系统需要重点考虑的原则之一。同时,要建立日志文件,跟踪记录用户对系统每一次操作的详细情况,并建立数据定期备份机制,提供数据灾难恢复功能。

从研发规划阶段开始,研发团队就把信息安全作为头等大事。系统选用了全球领先的阿里云服务器,该服务器作为“电商云”,在天猫双11、世界杯、12306、海关、微博运行良好,保证了系统数据的安全。用户只需关注公众号,无需下载手机软件(App),通过手机号码实名绑定即可进行使用,系统后台能够实时监控用户的使用情况,在简洁方便、易于推广的同时,确保了系统内资料的保密性及信息安全。同时,在系统的架构设计上充分考虑系统的开放性和可扩展性。为满足新业务范围的扩展需求,采用基于框架的组件化设计,当出现新的业务时,用户可以根据自己业务的需要进行系统模型的扩展和开发,只需添加新的业务组件即可。

3.2 智能高效的搜索引擎

生产技术管理系统创新性地运用了OCR光学字符识别技术,可以将PDF文档转换成txt文本,使系统能够对标准的内容进行匹配及搜索。用户可以按照标准的名称或内容输入关键字进行查询,系统会通过用户输入的关键字,利用txt文本与PDF版本之间建立的映射向智能显示模块推送搜索结果,最终显示出标准的名称、关键字出现的段落、关键字所在的页码等内容。用户可以根据需求,选择获取相应的标准信息,具体如下:

3.2.1 搜索模块

搜索模块建立与数据库的对比,采用白帽SEO技术优化搜索功能,用户发出一次搜索指令时搜索模块同时执行以下多个策略:

(1)全字符精准匹配:用户输入关键字,对比word版本的内容,如果所有字节全数匹配,推送该标准的书名、搜索内容出现页码等信息。

(2)语义拆分模糊搜索:用户输入关键字,程序根据句子自动拆分成数个汉字词语,对比word版本内容,在同一书名、段落中同时出现拆分的汉字词语时,推送该标准书名、搜索内容出现页码等信息。

3.2.2 定位模块

根据搜索模块推送word版本的页码段落信息,定位模块根据word版本与PDF版本建立的映射,向智能显示模块推送搜索结果,输出PDF文件书名、搜索内容出现段落页码等信息到智能显示模块。

3.2.3 智能显示模块

(1)标准查看(数据库访问)功能:智能显示模块根据定位模块返回的搜索结果向用户展示相应内容,允许用户访问数据库相应记录的链接。

(2)排序功能:定位模块返回的搜索结果是根据数据库录入时建立映射的数值大小排序的。为进一步优化用户体验,增强搜索功能,在法律法规数据库每条记录后添加一个热度计数器,计数器默认为“0”,每次经用户点击“查看”按钮后加“1”。系统向用户展示的搜索结果按照以下原则排序,且上一级排序原则大于下一级排序原则:

1)计数器数值从大到小排列;

2)全字符精准匹配高于语义拆分模糊排序;

3)标准名称匹配高于内容匹配。

3.3 实时有效的标准资源

生产技术标准管理系统能够查询国家标准、行业标准及电网标准,其爬虫功能可从万维网自动搜索法律法规及技术标准的更新信息,一旦搜索到更新信息会立即对管理员进行提示,使技术文件的更新及管理更加智能化。同时,系统可根据标准的使用频率、内容搜索次数等条件,通过搜索计数的方式进行大数据收集,优先展示热门标准,优化展示搜索结果。

3.3.1 爬虫模块

(1)定向网站爬取:在模块内设定某些特定的标准发布官方网址,在网址内爬取所有信息与数据库内的标准编号进行对比,因为标准编号是固定的,如《建设工程监理规范》为GB/T 50319—2013,因此爬取原则设置为当匹配到目标网址存在“GB/T 50319”字符,对比后面的字符大小,目标网址持有的记录比数据库记录的字符大时定义为标准有更新,提醒管理员更新。

(2)管理员反馈:当侦查到标准有更新时,发送更新信息到管理员账号,提醒管理员更新。

3.3.2 录入模块

管理员根据法律法规库、爬虫模块提醒、现实使用中用户反馈等信息来源,向数据库内添加标准信息。

(1)单个标准录入:录入标准的名称、英文名称、标准号、类别、发布部门、起草部门、施行日期、作废日期等信息,随后上传文件的PDF版本或word版本。

(2)批量标准导入:使用Excel编辑好标准的名称、英文名称、标准号、类别、发布部门、起草部门、施行日期、作废日期等信息,将Excel文件上传至系统内,自动形成记录,随后上传文件的PDF版本或Word版本。

(3)标准库建立:记录建立后,上传相应的PDF版本文件会通过OCR自动转换成Word版本,上传Word版本文件会自动转换为PDF版本,并重置该记录的热度计数器,然后建立一个内容一致但文件格式不同的法律法规数据库。互相转换时系统会在两个版本的标准之间建立相应的映射,映射包含的信息包括文件内容及内容相应所在页码,供搜索模块使用。

4 结语

本项目把微信公众号应用到生产技术标准管理工作中,通过研发该系统,进一步完善了公司的生产技术标准、法律法规体系,提高了公司信息化水平,改善了办公条件,使得管理更加高效化、规范化和科学化,为现场施工及督查提供了依据。

猜你喜欢
技术标准数据库微信
浅析科技成果转化为技术标准
深海采矿船技术标准的研究与制订
对特高坝抗震设计及相关技术标准的探讨
网络文学IP化的“技术标准”——以《琅琊榜》为例
微信
数据库
数据库
数据库
数据库
微信