改进的时间数据库在就业信息管理系统中应用研究

2015-11-24 00:45钟柳青
大众科技 2015年5期
关键词:冗余度时态信息管理系统

钟柳青

(广西工业职业技术学院,广西 南宁 530001)

改进的时间数据库在就业信息管理系统中应用研究

钟柳青

(广西工业职业技术学院,广西 南宁 530001)

传统数据库是数据进入数据库时所反映现实世界当前状态的描述。当状态发生改变时,需要通过合适的更新(插入、删除或修改)再映射到数据库当中,这种更新发生后,原先的状态通常就会自然而然地消失, 关系数据库就是一种传统数据库。只保存当前状态对于许多应用系统来说是远远不够的,这是就需要时间数据库的存在。时间数据库建立的意义在于时间属性的应用,重点在于能够在一定范围的时间范围内解释数据,同时能够方便的存储与处理历史信息。时间数据库的这种作用正是目前广泛应用的关系数据库所欠缺。时态模型需要解决的两个核心问题就是时间事件处理机制和应用系统建立时间表示方法。目前的应用系统中时态数据主要用来计划制订与结果预测、实时系统的控制、不完整时间信息的处理以及历史情形的分析与研究。

时间数据库;就业信息;时间属性

1 引言

随着高等职业院校的招生规模扩招,毕业生的数量增多,在学校就业指导过程中有大量的就业信息数据需要处理,已经充分形成了毕业就业市场。因此,需要一个高效稳定、可以实现资源共享的就业信息管理系统给高等职业院校用于就业信息管理。通过调研分析广西工业职业技术学院毕业生就业管理需求,结合就业部门实际情况,作者分析了该就业信息管理系统的各个功能模块,具体阐述了本系统所开发的就业信息管理网络化的实现。该系统能地满足广西工业职业技术学院毕业生就业信息管理的需求。之前所做的主要工作包括:

(1)分析传统就业信息管理中存在的不足,得出研究与开发毕业生就业信息管理系统是目前就业市场的需求,同时分析了该就业信息管理系统开发的意义。

(2)分析了广西工业职业技术学院毕业生就业信息管理系统的设计目标和功能需求,特别是具体分析了系统安全需求和非功能需求。

(3)详细分析了系统的设计原则、系统总体架构设计、数据库设计、系统安全设计等。

(4)介绍了就业信息管理系统的各个系统功能模块,如添加、删除、修改企业、毕业生、招聘等信息。

但是,本系统在应用上还存在一些不足之处,例如在数据库设计上没有对时间轴进行考虑,因此无法精确处理时间数据。

2 理论概述

双时态概念数据模型(Bitemporal Concept Data Model,BCDM)是众多的时态模型中应用最为广泛的一种双时态模型,它主要基于TSQL2语言,重点在于语义表达时态数据。双时态概念数据模型在时间轴上存储的是一种时间片段,每一个事务对应一对时间点,一个事务可以对应多个属性改变的记录。

将BCDM模型进行扩展到数据库应用系统中,在系统设计上需要抽象出时间属性,时间属性和关系属性分开设计的一种新的建模方法称为UTCM模型,UTCM的最大特点是在BCDM的基础上分离时间属性,既保持了关系数据库上的所有特性,又将时态关系链接到关系模型来设计。这样,一个实体可能对应着多个时态属性,一个时态属性也可以对应与多个不同实体。

3 实验步骤

步骤1:分析需求,建立关系数据类图、用例图等;

步骤2:分析实体,将有时态需求的实体按单维度时态需求和双时态需求进行标识并划分出来;

步骤3:分析每个实体属性的使用频度与应用倾向;

步骤4:根据上述四种类型对每一个实体进行属性的划分与归类;

步骤5:将归类的属性建立时态属性类,并进行模型的合理性与必要性评估;

步骤6:与关系模型进行整合,评估系统的复杂度并进行适当的调整与精简;

步骤7:进行数据表的设计,确定时态属性的粒度与存储类型,完成模型设计。

4 实验分析

实验环境采用的是PC(Pentium 4,CPU 3.00GHz,内存512M)台式电脑,Windows XP操作系统,C#程序编写语言。实验数据通过实时运行中的科研管理系统的2009年版本中三个有代表性的数据集合进行采集。TT型:用户关系数据,共有3468条数据,去除无时态记录的数据后取实验用数据2600条;VT型:重点项目关系数据,共有1470条数据,去除不符合要求的数据后取实验用数据1000条;BI型:分值映射关系数据,共有6730条数据,取代表性数据3000条进行实验。根据关系数据库的运算特征,将时态数据库中的UC与Now标识设置为9999-12-31 23:59:59.997,根据具体属性的时间粒度进行精简,这样就可以将关系数据库不支持的时间表示转为date time类型,有利于时间单位的换算速率。

BI型实体中,改进的UTCM模型和BCDM模型基本上采用了相同的存储结构,因此在曲线上也表现出了一致的特性,在数据量大于 200时,逐渐优于关系模型的存储结构,改进的UTCM模型因为存在着实体属性类别的判断,所以在数据模型复杂度上要高于BCDM模型。详细的数据记录与图表对比如表1、图1所示:

表1 冗余度实验数据结果

图1 冗余度分析

图2 冗余度分析

图3 冗余度分析

速率实验中可以看出在减下冗余度的同时不可避免的要以牺牲速率为代价,关系模型在速率上更加占优势,实验对比数据单位为毫秒。

VT型实体中,因为有效时间在纵向时间轴上变化的数据是比较有限的,关系模型、BCDM模型、改进的UTCM模型这三种模型在时间上表现出基本相同的变换趋势,所以各种模型的区分度不是那么明显。但是还是可以看出关系模型需要的访问时间最少,改进的UTCM模型在时间效率上要略优于BCDM模型,改进的UTCM模型比较适合用于应用系统建模。

TT型实体中,随着数据量增大的同时耗费时间也随之增大,关系模型在速度上的优势更为明显,TT型记录的事务数据量比VT型记录的规模要大,所以复杂的模型带来了时间上更多的损耗,同时可以在对比中看出改进的UTCM所用的时间要优于BCDM模型。

BI型实体中,改进的UTCM模型在数据遍历的寻址过程中关系模型只需要进行一轮数据表内的顺序索引查找,而BCDM模型需要根据实体编号进行跨表查找,在跨表的同时还增加了类别选择进而更加损耗了时间,所以改进的 UTCM模型在速率上要优于BCDM模型。详细的数据记录与图表对比如表2和图4所示:

表2 速率实验数据结果

图4 速率分析

图5 速率分析

图6 速率分析

通过以上的实验结果可以总结出,关系模型的单一结构能够在时间执行效率上处于优势位置,这也正是关系型数据库结构所带来的优势,但从时态结构的支持上和数据的冗余度上并不能很好的符合时态需求;BCDM模型虽然在原有关系模型上做了改进,抽出的时态类也优化了数据冗余,但同时也损耗了一部分时间;改进的UTCM模型进一步抽出不同维度上的时态属性进行分类,因此在总体时间效率上要略优于BCDM模型,也改善了实验数据的冗余度,特别是在处理TT型时态实体的时候,优势更加突出。虽然由于数据集具有一定的特例性,实验结果只是大致反映了模型的变化趋势,但模型的建立方案可以为绝大多数应用系统采用,在实际的系统应用中,可以根据应用系统的具体时态需求来选择适合的模型。

[1]李争艳,李贞双.时态数据库浅析[J].科技信息,2008,(25): 79-80.

[2]Zar Linn, Khin Haymar Saw Hla. Temporal Database Queries for Recommender System using Temporal Logic [J].Micro-NanoMechatronics and Human Science, 2006, 25(12):79-86.

[3]Abdullah Uz Tansel, Susan P. Imberman. Discovery of Association Rules in Temporal Databases[C].Information Technology,2007,(7):536-545.

[4]高艳云.时态数据库及其发展趋势刍议[J].民营科技,2009, (11):20-21.

[5]李宝方,邢玉清,樊彩霞.基于 TimeDB的时态数据库应用研究[J].焦作大学学报,2009,(2):85-87.

[6]Carlo Zaniolo. Event-Oriented Data Models and Temporal Queries in Transaction-Time Databases[C].International Symposium on Temporal Representation and Reasoning, 2009,(16): 47-53.

[7]Achraf Makni, Rafik Bouaziz. Performance Evaluation of an Optimistic Concurrency Control Algorithm for Temporal Databases[C].Second International Conference on Advances in Databases,Knowledge and Data Applications,2010:75- 81.

[8]刘冬宁,汤庸.时态数据库时间轴的动态逻辑模型[J]. Journal of Software,2010,21 (4):694-701.

[9]Zheng Pan, Shujun Deng. Vessel Real-Time Monitoring System Based on AIS Temporal Database[J].Information Management,Innovation Management and Industrial Engineering,2009:611-614.

[10]师胜利,董瑞卿,杨彦锡.时态数据库在电子商务中的应用[J].计算机与信息技,2008,26 (3):73-74.

[11]黄振国.财政绩效分析时态模型[D].郑州:河南大学,2009.

[12]赵亮,白尚旺,党伟超.基于时态关系模型的儿童保健系统的设计研究[J].太原科技大学学报,2008,29(5):339-342.

[13]Marcos R. Vieira, Enrique Frias-Martinez, Petko Bakalov, Vanessa Frias-Martinez,Vassilis J.Tsotras. Querying Spatio-Temporal Patterns in Mobile Phone-Call Databases[C]. Eleventh International Conference onMobile Data Management (MDM),2010:239 -248.

[14]朱建平,来升强.时态数据挖掘在手机用户消费行为中的应用[J].数理统计与管理,2008,27(1):42-53.

[15]罗晨.基于时态数据库双向关联规则挖掘的研究[D].济南:山东大学,2009.

[16]陈卓,杨炳儒,周法国.基于时态逻辑的多时间序列挖掘模型[N].辽宁工程技术大学学报(自然科学版),2009,28(4): 604-607.

[17]王光明,亢院兵.时态数据库探讨及应用[J].福建电脑,2008,(12):152-153.

[18]李跃,张华.时态数据库理论研究[J].大庆师范学院学报, 2006,26(5):101-105.

[19]Nikos Papadakis, Grigoris Antoniou, Dimitris Plexousakis. The Rami cation Problem in Temporal Databases: Concurrent Execution with Conflicting Constraints[C]. Tools with Artificial Intelligence,15th IEEE International Conference on,2003.

Application of improved time employment information database management system

Traditional database data into the database is reflected in the description of the current state of the real world. When the state changes, through the appropriate update (insert, delete, or modify) and then mapped to which database, after this update occurs, the original state generally will naturally disappear, a relational database is a traditional database. Only saves the current state of the system for many applications is not enough, this is the time we need the existence of the database. Meaning that the application time database creation time attribute, the focus is the ability to interpret the data in a certain range of time, and can easily store and process history information. This database is the role of time the widely used relational databases lacking. Two core issues to be resolved when the state model is time event processing applications to establish mechanisms and time representation. The current state of the data when the application system is mainly used to plan development and outcome prediction, real-time control systems, analysis and research process and historical circumstances of the time the information is incomplete.

Time database; employment information; time properties

TP181

A

1008-1151(2015)05-0010-03

2015-04-10

钟柳青(1976-),女(毛南族),广西柳江人,广西工业职业技术学院助教(处长),研究方向为软件工程。

猜你喜欢
冗余度时态信息管理系统
高速公路桥梁设计冗余度应用
三维可视化信息管理系统在选煤生产中的应用
信息管理系统在工程项目管理的应用
超高清的完成时态即将到来 探讨8K超高清系统构建难点
过去完成时态的判定依据
基于三维TGIS的高速公路综合信息管理系统
桥梁设计的冗余度分析
桥梁设计的冗余度分析
人事档案信息管理系统的设计与实现
桥梁设计的冗余度