藏汉双语应急救灾专题数据库系统建设及质量控制研究

2014-04-29 01:31曹方杨生举苏海龙蒙杰
安徽农业科学 2014年26期

曹方 杨生举 苏海龙 蒙杰

摘要 采用PHP技术、XML技术和数据库技术,基于B/S/D 3层架构设计完成的藏汉双语应急救灾专题数据库系统,涉及了从采集、加工、发布、检索到管理的专题数据库建设全过程,满足用户快速建立藏汉双语应急救灾数据库的需求,突破在藏区应急救灾过程中藏语与汉语信息沟通的障碍,为应急救灾争取时间,降低灾害损失;加强对数据库的质量控制,为应急救灾提供高质量的数据支撑。详细介绍系统研发所采用的PHP和XML等关键技术、系统的整体架构、系统的设计和实现过程、数据质量的控制方法,并给出关键代码,最后介绍该系统的应用情况。

关键词 应急救灾;XML;PHP;专题数据库

中图分类号 S126;TP315 文献标识码 A 文章编号 0517-6611(2014)26-09228-03

数字信息爆炸式增长给人们带来方便的同时也带来了极大不便,如何从海量的信息中快速、高效、准确地检索到自己所需的有价值信息,是图书情报界研究的一个重点。专题数据库的构建和应用是解决这一难题的有效途径之一[1]

用户对信息的需求不断向专、深化发展,使得专题数据库的研究越来越受到重视。所谓专题数据库是用户所需的专业性的、专题化的信息资源,从海量的信息资源中通过采集、标引和组织等工作而建立的数据库。

应急救灾专题数据库是指当灾害发生后,应快速查明灾情,及时展开应急救援活动,做到正确果断地指挥决策,从而为决策者快速、准确地提供灾区人口、自然地理地貌、交通、重要目标位置、联络方式等基础信息的专门性数据库,是政府迅速、有效应对地震、泥石流等突发事件的重要决策依据,对于提高政府防灾减灾和应对突发事件能力具有十分重要的意义。

数据的质量是数据库建设的根本所在,若不重视数据质量的控制,建成的专题数据库使用价值可能很低甚至带来负面价值,而在应急救灾的紧急情况下,数据的质量变得更为重要,是进行科学高效救灾的前提[2]。该研究从数据完整性、准确性、安全性等方面阐述了如何加强数据库的质量控制。

藏汉双语应急救灾数据库的建设将为藏区的应急救灾提供强有力的数据支撑,突破应急救灾过程中藏语与汉语信息沟通的障碍,为应急救灾争取时间,降低灾害损失。

为此,笔者详细介绍了系统研发所采用的PHP和XML等关键技术、系统的整体架构、系统的设计和实现过程、数据质量的控制方法,并给出了关键代码,最后介绍了该系统的应用情况。

1 系统总体架构

应急救灾专题数据库主要包括人口数据库、行政区划数据库、地理交通数据库、地形地貌数据库、重点部位多媒体数据库、气候要素数据库、联络方式数据库。藏汉双语应急救灾专题数据库系统的建设是采用藏语、汉语两种语言同步完成专题数据库信息的采集汇总。

普通用户通过浏览器访问WEB服务的基本功能模块;决策用户通过身份认证后访问WEB服务的授权功能模块;系统管理员通过数据发布系统发布专题数据,并对数据进行维护管理。WEB服务器通过ODBC技术访问数据库服务器上的应急救灾专题数据库,如乡镇人口数据、交通数据、社区行政区图数据等。系统总体架构图如图1所示。

2 关键技术

2.1 PHP技术

PHP(Hypertext Preprocessor,超文本预处理器)是一种在服务器端执行的嵌入HTML文档的脚本语言[3-4],完全是开源的,可以从中加入自己需要的特色。PHP的优点:容易与HTML网页融合,执行效率高;内嵌在HTML主页里,修改成本低,开发速度快;消耗较少的系统资源;跨平台运行;具有丰富的函数接口;公开API函数,很容易增加模块,进行语言扩展;支持几乎所有流行的数据库以及操作系统;具有完善的和不断增强的XML支持功能;在Web服务器端运行,且具有很高的安全性[5]

2.2 XML技术

XML( Extensible Markup Language,可扩展标记语言)是一种W3C标准[6],主要用于Web应用程序和服务器之间的数据交互、存储和使用[7]。它是一整套定义语义标记的规则,允许用户对自己的标记语言进行定义,这些标记将文档分成许多部件,并对这些部件加以标识[8]。在系统开发中利用XML可轻松地格式化显示来自几乎任何数据源的数据。XML已在Internet界被广泛接受和使用,成为数据交换、存储的重要标准[9]

3 系统设计

3.1 系統功能设计

应急救灾专题数据库系统主要包括人口数据库、行政区划数据库、地理交通数据库、地形地貌数据库、重点部位多媒体数据库、气候要素数据库、联络方式数据库。人口数据库包含总人口数据、人口构成、人口分布等信息;行政区划数据库包含县区、乡镇、社区的行政管辖划分等信息;地理交通数据库包含区域的铁路、公路、航空、水运及各种交通运输方式的优缺点等信息;地形地貌数据库包含区域所处的地理位置、地形地势、土地覆盖、高程、坡度坡向等信息;重点部位多媒体数据库包含灾害易发区、交通枢纽处等重点部位的图片、视频资料等信息;气候要素数据库包含区域的平均降水、平均温度、湿度、气压、日照等信息;联络方式数据库包含乡镇、社区每村每户的联系地址、联系电话、联系人、移动通信情况等信息。

系统用户角色分为普通用户、决策用户和系统管理员。普通用户具有的功能为数据检索、二次检索、聚类检索、分类检索等;决策用户具有的功能为授权数据检索、分类检索、发布紧急通知、数据批量导出、统计报表导出等;系统管理员具有的功能为用户管理、数据管理、元数据设计、XML模版设计等,其中数据管理包括数据批量导入导出、数据录入、数据审核等子功能,用户管理功能实现用户信息的增加、删除、修改以及系统权限的设置。

3.2 数据库设计

系统通过建立与数据库服务器的连接,来完成对数据库的操作,从而达到对数据信息的存储、管理、检索的目的。数据库系统采用Windows环境下关系型数据库SQL Server 2008,这个版本增强了对XML数据的支持,使用XML数据类型能够直接存储XML文档。

系统的数据库设计分为需求分析、概念设计、逻辑设计、物理设计、实施、运行和维护几个阶段。需求分析阶段综合分析各类用户的实际需求,是整个专题数据库设计过程的基础;通过对用户需求的综合整理、归纳抽象,形成一个独立于具体数据库管理系统(DBMS)的概念模型;逻辑设计阶段将概念模型转换成具体的数据库产品支持的数据模型,并对其进行优化,形成数据库逻辑模型;根据数据库管理系统(DBMS)的特点和处理的需要,为逻辑模型选取合适的物理结构,进行物理存储、索引建立;运用数据库管理系统(DBMS)提供的数据语言、工具,依据逻辑设计和物理设计的结果,建立数据库系统,编制调试数据库应用程序,部署试运行,并不断对其进行评价、调整和优化。

3.3 元数据设计

元数据设计包括元数据集和元数据项设计。元数据集主要用于描述和标识元数据,包括数据项名称、数据标准(自定义格式和都柏林格式)、语种(汉语、藏语)、字符集(UTF-8、GB2312、GBK)、创建日期、数据集摘要、数据分类、数据质量说明等内容。元数据项主要用于建立数据库中存储的XML映射字段,包括字段名、类型、中文名、藏文名、默认值、检索标识等。

3.4 XML模版设计

XML模版设计包括题录显示模版和文摘显示模版。题录显示模版用于配置一条数据记录的基本信息,通常包括标题、关键词、数据集联系人信息等。文摘显示模版用于配置一条数据记录表示内容特征的字段信息(包括题录信息)。以人口数据库题录显示模版为例的XML配置文档如下:

page_num="50" attribute="width=100%">

<![CDATA[

title.value

source.value

pub_date.value