艳 红 特木其乐 万 福 萨如拉
(内蒙古国际蒙医医院,内蒙古 呼和浩特 010065)
自从书面语言诞生以来,拼写校对就一直伴随着人类。传统的校对工作采用人工进行,费时又费力。基于现代信息技术的校对方法为提高校对工作效率创造了良好的条件。相比之下,基于现代信息技术的校对方法具有极大优势,不仅能节约人力资本,提升校对效率,而且校对准确性也有明显的提高。目前许多领域中已经应用信息化校对技术,而蒙医药领域中的应用较少,本文对信息化校对技术应用于蒙医药领域进行了研究。
蒙古文的书写方式与汉文和西文有着很大的不同,它被公认为是最难信息化的文字之一[1]。由于蒙古文有同形异音字母和一些字母的变体相同的情况的存在,在用计算机输入蒙古文时很容易混淆这些形状,也存在一些人为了更快捷的输入而有意的用形状相同的变体代替原字母变体的情况。这些输入方式都违反了蒙古文正字法和控制符使用规则[2]。蒙古文正字法是正确书写蒙古文的基本规则,是蒙古文语法的重要组成部分。蒙古文正字法自蒙古文诞生之日起不断的发展、完善,今天已成为一个非常完整、严格的规则体系[3]。
病历是患者在医院诊断治病全程的原始记录,病历作为患者信息的载体,集中反映了患者的诊断治疗过程。医院信息系统的发展程度直接反映在对病历内容的覆盖范围上,可以说病历是医院信息系统之本。近年来,随着信息技术的发展和计算机的广泛应用, 特别是医院管理信息系统的建立, 应用计算机技术,全程管理患者信息的电子病历得以飞速的发展。电子病历及药品信息管理是医院信息管理系统的重要基础,而如何保证记录的电子病历及药品信息文字正确也是非常重要的。目前很多蒙医医院都在使用蒙古文电子病历及蒙药管理系统,但是由于使用者的蒙古语言水平不一样,避免不了出现各类违规了正字法的错误。因此,研究设计一种蒙医药校对系统是非常必要的,从而能够减少蒙古文电子病历及蒙医药信息中出现的不必要的错误,提高蒙古文电子病历及蒙医药信息管理的质量。
基于规则的处理方法是最初的自然语言处理中最普遍使用的方法。基于规则的处理方法通过将成词、成短语和成句的各种情况抽象成规则,然后对照规则库对输入文本进行各种处理[4-5]。基于规则的方法优点是无需大量的语料,只需要制定一系列规则,根据这些规则判断是否相匹配。本文将基于规则的校对方法应用到蒙古文中,设计出校对系统,再将这些技术与医院蒙医药相关信息结合,实现了蒙医药校对系统,见图1所示。
3.1 系统技术实现 本系统是基于PHP语言开发,使用HTML5作为系统页面展现。PHP将程序嵌入到HTML文档中执行,与完全生成HTML标记的CGI相比其执行的效率高很多,而且可以执行编译后代码,编译可以达到加密和优化代码运行,使代码运行速度更快。同时本系统结合AJAX技术即综合性的浏览器端网页开发技术组合开发,使用AJAX技术后使得浏览器与 web 服务器之间的数据异步传输,减少请求服务器数量,提高程序运行及响应速度。本系统数据库采用MySQL数据库,它是一种开放源代码的关系型数据库管理系统,使用结构化查询语言即SQL进行数据库管理。系统采用ThinkPHP框架,分层架构采用3层架构模式,即包括表现层、业务逻辑层和数据访问层。服务器是以模块化的Apache作为应用服务器。
3.2 功能模块的实现 系统功能模块由系统管理和文本校对两大模块组成。
3.2.1 系统管理模块
3.2.1.1 蒙医药校对系统登录模块:校对系统登录模块中可以通过输入账号和密码登陆系统,该账号必须通过系统管理员分配相应权限建立账号,见图-2所示。
3.2.1.2 用户管理模块 用户管理模块具有添加用户、修改用户信息、删除用户信息和审核账号启用状态等功能,见图-3所示。
3.2.1.3 权限管理模块 权限管理模块中主要分配用户权限。用户分为超级管理员、系统管理员和普通用户等三种,可根据用户角色不同,分配不同的权限,即登陆后看到的菜单不同。超级管理员具有使用所有菜单的权限,见图-4所示。
3.2.1.4 字典管理模块 字典管理模块具有维护常用数据的功能。
3.2.2 文本校对模块 文本校对模块共分5步进行处理。
第一步 文本预处理:通过程序界面录入或导入文本,读取原始文本,将文本存入数据库C_BEFORE字段中,在系统界面“校正前蒙古文”文本编辑器中显示。
第二步 编码转换:将C_BEFORE字段中的文字转换成对应的unicode编码,存入U_BEFORE字段中,待校对。
第三步 文本查错:根据已经建立好的规则库,查找U_BEFORE字段中的错误。
第四步 文本纠错:将通过文本查错功能查出的错误结合建立好的规则库进行纠错,并将纠正好的文本存储到数据库U_AFTER字段中。
第五步 编码转换:将U_AFTER字段中的unicode编码转换成对应文字并存入C_AFTER字段中,最终在系统界面“校正后蒙古文”文本编辑器中显示,见图-5所示。
本文利用自然语言信息处理技术的同时结合软件工程相关理论,设计并实现了蒙医药校对系统,通过系统的应用可以校对蒙医药信息化系统中文本错误,从而提高蒙医药信息化管理的质量。