1NF模糊时态数据库数据模型

2012-04-29 02:21黄楠
电脑知识与技术 2012年30期
关键词:数据模型数据库

黄楠

摘要:为了使时态数据库能够更准确的表达现实世界事物的模糊属性,使之更加符合人们对客观事物的分析判断习惯,提高据库数据模型的映射能力,优化不同种类数据的相互转换过程,符合广泛用户定义的要求,我们针对同时具有时态性和模糊性的复杂数据,着手于时态数据库模型,建立起一个能够反映模糊时态数据的1NF模糊时态数据库数据模型,以对确定的及不确定的模糊时态数据做出模拟表达,同时还做了相关规则及操作元素的语义演算和分析,并从理论上对运算模型及模糊时态映射关系进行了数学论证,从而利用模糊的时态数据将事件的不确定性映射出来,提高了时态数据库有关模糊时态信息的直观性。

关键词:模糊时态;数据库;数据模型

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)30-7156-02

随着人们对数据库的使用率越来越高,也越来越觉得现有的数据库技术跟不上时代要求,往往不能对现实的客观世界作出更为准确的反映。由于每个事物总是随时间而不断产生变化,有关物理流信息流包中包含时间信息、相对时间信息及时间区间信息等时态信息内容。通常数据库系统在处理时态数据的过程中仅仅将其时态属性做简单处理,处理后的时态数据往往不能精确地反映事物的真实信息,造成部分时态信息缺失。随着数据库的建立并不断完善,时态信息技术也得到了迅速发展,自上世纪末开创至今已具产品化、模型化,时态信息的发展过程中,大量的科研成果相继应用到其中,如事物时间、区间时间、双时态、有效时间等概念。目前,时态数据库已成为众多学者和专家的共同研究领域,全球范围有关的科研团队有近百个,建立起的各种模型有近20个,相关报道及发表的文章也越来越多。

能够准确反映客观事物的数据信息往往都是模糊的,而有关模糊时态数据库技术方面的报道和文献还很少,目前只能在试验阶段的模型中实现时态系统,还不够规范、完整,并缺少有效的信息挖掘技术支持,如文献[2、3]中所建立起的时态关系代数。在本文中,介绍了一个与参考文献[4、5、6]中数据库模型相对应的模糊时态代数理论,包含时态日历、模糊度等信息,并加以模糊时态约束,同时还做了相关规则及操作元素的语义演算和分析。

1 模糊时态及相互关系

为了将历史事件在表达其区间关系时能更符合人们的观察习惯,用数学理论上的实数轴代表时间轴,并用R表示,根据现实时间状态时间粒度用年、月、日、h、min、s、ms表示。在这里时间轴被时间粒度划分成无数个很小的等长段,长度是根据信息需要的以粒度表示的最小时间单位,即时刻,也就是现实事物的时间点,并用ti表示。这里的时间点可以是一个精确的值,也可以是模糊的集合,精确的值包含于模糊的集合内,只是集合的一个特例。各时间点的相互关系类型分为定性关系及定量关系。定量关系在时间轴R上将时间点间的定量关系体现为距离函数,f(n):{n=Δt |Δt =( tje-tis ,tjs-tie)},式中tis、tie是R轴上的时间点,其定性关系是表达两个或多个时间点在时间轴上的距离关系,时间点定性关系同样可以是一个精确的值,也可以是模糊的集合。

时间区间与时间点不同,但同时又来源于时间点代数理论,是由两个在时间轴R上的时间点划分出来的时间段。时间区间同样可以是精确的值或模糊的集合,分别用二元组T =(T-,T+)及T*=(T-,T+)表示。由于时间点的不确定性,又可将T*=(T-,T+)分为三种情况:T*=(T*-,T*+)、T*=(T-,T*+)、T*=(T*-,T+)。式中,T-、T+代表时间区间的时间点;*代表模糊算子,用来表达时间点或时间区间的不确定性。

2 模型的建立和演算

设模糊集是一个端点模糊的实数区间,则该区间是规范化的、凸的,其表达函数在论域X上是分段连续的,即“模糊数”。定义一个-T为模糊集,表示为二元组形式:T=(α,Γ),α是χ在论域X的值,Γ是χ相对于论域X的隶属度,Γ∈[0,1]。定义-T1、-T2为2个模糊集,其语义距离可用D(T1,T2)表示,D(T1,T2)=Δ1-1n∑ni=1|TT1(Γi)-TT2(Γi)|。同时也可以加权科夫基距离来进行定义。对象T1,T2,…,Tn构成一个有限集合,即模糊集R。这里的每个对象Ti均与其值域d(Ti)成对应关系。由上述模糊数的定义可知,每个对象Ti在其值域上所有的分布值共同组成了它的模糊集,这一集合便是对象Ti的模糊值域。因此,对象模糊值域也可分为两类:有限和无限,固Ti={(α,Γ)|α∈X}中,若X为有限的对象模糊值域,则上式可由Ti=∑Ti(αi) /αi代替,若X为无限的对象模糊值域,则上式可由Ti=∫Ti(αi)/αi代替。其中的“/”只是一个特定符号,仅用来说明论域X中对象α和隶属度Ti(αi)间的相互对应关系,并不是普通意义上的分数线;式中的“∫”及“∑”也不同于积分及求和的一般定义,均用来表示论域X中对象α和隶属度Ti(αi)间相互对应关系的总体。模糊数可分为定性模糊数据和定量模糊数据,在处理定性的模糊数据时,可仅做“=”及“≠”处理,而在处理定量模糊数据时,我们要做大小比较。在特定的时间内发生的事件,其实际模糊值和时间的关系可表示为模糊数据-T=(α,Γ),若Γ的值为0,则α不存在,在这里模糊值Γ与时间t的关系可以用一个映射函数来表示。

3 结论

本文中我们在模糊集理论的基础上建立了1NF模糊时态数据库数据模型,以对确定的及不确定的模糊时态数据做出模拟表达。同时还做了相关规则及操作元素的语义演算和分析。并介绍了模糊时态数据库数据模型理论,引进了模糊映射知识,利用模糊的时态数据将事件的不确定性映射出来,从而提高了时态数据库有关模糊时态信息的直观性。

参考文献:

[1] 邓立国,马宗民,张刚.基于模糊集的不精确时态关系建模[J].东北大学学报:自然科学版,2007(10).

[2] 赵鹏,谭萍,王小龙,等.面向对象的本体建模应用研究[J].科学技术与工程,2008(10).

[3] 赵晓,陈桦,侯勃峰.一种实现数据库数据到XML文档的转换方法[J].西安工业大学学报,2007(4).

[4] 蒋夏军,吴慧中,李蔚清.高层体系结构中的时态数据管理[J].兵工学报,2006(3).

[5] 杨小萍,李德录.一种面向对象的双时态数据模型[J].河北理工大学学报:自然科学版, 2010(3).

[6] 刘冬宁,汤庸.时态数据库时间轴的动态逻辑模型[J].软件学报,2010(4).

猜你喜欢
数据模型数据库
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
数据库
数据库
数据库
数据库
数据库
财政支出效率与产业结构:要素积累与流动——基于DEA 和省级面板数据模型的实证研究
基于分位数回归的电力负荷特性预测面板数据模型
面向集成管理的出版原图数据模型