分布式数据库管理系统中的RNN方法*

2013-04-07 05:36蒋本天李英梅
关键词:神经元网络分片代价

蒋本天,李英梅

(哈尔滨师范大学)

0 引言

分布式数据库环境一般包括两个以上的地理远程地点.相互联系的地点不完全拥有软硬件,而软硬件涉及数据库管理及应用.分布式数据库设计的步骤:先进行全局概念设计,进而进行局部概念设计,分布式环境中局部概念设计对数据库进行分段.分布式设计决策决定如何进行数据分段、复制和分配.该文中论述数据库分段步骤,考虑了用辐射函数神经元网络的非线性算法和能自动检测最佳分段方法的随机神经元网络来总结和选择分段技术.

已经开发了许多数据库分段技术来物理的组织存储器中数据.每种技术都先将数据分组,然后将这些组分配到物理页中,这些物理页可分为六类:水平模块、组水平模块、单个垂直分片、物理垂直分片、组垂直分片和混合分片.水平分片用来为一个关系赋值为具有相同属性的不同元组.单个垂直分片由关系和关键属性货源组标识一列组成.垂直分片方法对于分布式数据库中数据库的设计和分析极其重要.物理垂直分片方法对固定大小的物理组进行划分.没有数据库管理系统使用这种方法.水平分片与垂直分片方法的结合称之为混合分片方法.

随机神经元网络是性质相同的神经元网络的一种简单形式,以概率角度对它的特点进行描述.我们研究的网络以异步方式运行,并以外部激励形式接收环境的影响.用马尔可夫过程对网络的操作进行描述,马尔可夫过程稳态解给出了网络行为的几个全局度量.

1 随机神经元网络方法

神经元网络及它的特殊分支——随机神经元网络是在1989年定义的,在1990年对其进行了扩展和总结.它的特色十分有趣.因为该模式的信号像传统网络结构的电压尖峰而不是固定的值,它似乎更接近真正的生理物理神经元网络.仅用一个计数器代表一个神经元更容易进行计算.因而硬件上是可实现的.

2 解决数据库分段问题的辐射基函数网络和神经元网络方法

Poweu(1985)在解决实多变量插值问题时首先引入了辐射基函数.Broomhead和Lowe在设计神经元网络时,首先使用了辐射基函数.以最基本形式构造辐射基函数,涉及三个完全不同的层.第一层:由源结点组成的输出入层,第二层为隐藏层,它的尺寸足够大.输出层根据输入层的激活向量生成网络的解.从输入空间到隐藏单元空间的转换是非线性的,而从隐藏层到输出单元空间的转换是线性的.若使隐藏单元空间的中心部分具有可适应性,则减少隐藏层空间的尺寸是可能的.

2.1 输入及输出参数

我们可以下列参数作为神经元网络模型的输入:

(1)存储关系所需的物理负的负号.

(2)重组织的代价,重组关系的代价(从存储器中删除及重载入).

(3)从一个模式中删除一个条目的代价.(4)向模式中添加一个条目的代价.

(5)访问条目的代价.即从给定关系的所有记录中删除条目的代价.

(6)重选一条记录的代价.即从给定关系中选择一条记录的代价.

(7)向关系中加入一条新记录的代价.

(8)修改一条记录的代价.即修改一条给定记录的某些私有条目的代价.

2.2 辐射基函数网络算法

算法1:静态培训模型.为每种分段方法计算学习系数,进而进行代价分析.学习处理过程之后,用学习系数为每个输出入集计算输出序列.每个输入集代表一种不同的分段技术.算法1称为静态培训模型,它包括常值矩阵.

算法2:动态培训模型.没使用纠错机制.因而算法1有错误累积.可用纠错机制来评价算法2.算法1和算法2都使用了欧氏距离.但算法2包括去掉欧氏距离中的1/0元素的简单值.算法2根据常量矩阵自动检测哪些输出参数依赖于输出入参数.对每种分段技术算法2首先使用评估向量W.

2.3随机神经元网络算法

(1)将这个负值置0,在第k步因这个负值结束循环,第k+1步将从该值的当前值0开始,按照这个值遵循同样规则进行循环操作.

(2)返回该变量的前一个值,用更小的n值进行循环.

3 输入神经元网络的培训数据,计算权值常量

一个分布式数据库环境建立起来了,按照模型,我们先选择输入、输出值,那么神经元网络模型得以培训.权值常量向量W计算后,数据库分段方法的总体代价值就优化了.因而提出的神经元网络模型是独立于平台的方法.与分段技术所用的线性法不同,我们正在实现文献中提到的第一个非线性方法.用这种方法对所获得的权重的计算很精确,加之提供了与其它分段技术相比较的环境,人布式数据库系统中数据库的分段与分配所需的库结构独立于平台,最重要的是,它独立于数据库模式.

每种分段技术对应的神经元网络正在运行,因此用得到的数据集来比较分段技术.该模型的另一个优点是,找出分段技术的参数据库和输出值来设计一定数目的数据库模式之后,将得到与每种技术对应的权值常量和权值向量.得到系统常量之后,在给数据库模式分段的过程中,我们将访问该数据库并仅从输入参数和以前指定的权值直接得到输出值.这是神经元网络的主要特色.

如果很精确地进行系统测试并提供输入输出值,神经无限制网络算法将给出有效的总代价级.下一部分将了解到辐射基函数网络算法的计算速度很快,但一般来说,单向方法和水平方法的代价级相互重叠,随机神经元网络的培训时间和辐射基函数神经元网络算法2的培训时间比辐射基函数神经元网络算法1的培训时间要长,但它又为分段选择决策提供了无重叠输出.

4 神经元网络模型的性能比较

线性方法得不到我们要解决的问题的真正的解.然而当改变参数时,线性方法不能决定哪种方法是最好的.因而,首先用辐射基函数神经元网络方法来培训一个网络,然后改变参数来对差别进行跟踪.针对这种方法,提出了两个方法:静态算法和动态算法.

静态辐射基函数神经元网络算法认为特定的输入值与唯一特定的输出值有联系.从而处理时间减少了,并提出了定义所涉及的具有不同特性的动态算法.但这种方法也存在问题,单向垂直分段方法的列访问参数与物理分段方法的更访问参数相同.取决于这些问题,我们可以选择水平分段方法或单向垂直分段方法进行总代价函数的计算,提出了RNN方法和RBFNN算法来消除这个过载问题.

随机神经元网络方法和辐射神经元网络方法遵循同样策略.首先,我们培训网络,然后用权值常量来测试输入并考查结果.这种方法消除了过载的输出值,因而不用计算总代价函数我们就能决定哪种分段方法是最好的.

5 结束语

设计分布式数据库系统所要考虑的第一特色是用最小代价把中心数据库划分为了数据库.以上我们力图解释的操作及方法是借助可培训的神经元网络模型,用权值常量而不是对系统中的所有表和关系进行分段测试,可计算结果.因此,培训完神经元网络之后确定使用哪种分段技术就变得很简单了.

[1] Ceri S,Pelagatti G.Distributed Databases Principles and Systems,McGraw Hill,1986.

[2] Tamhankar A,Ram M S.Database agmentation and Allocation:An Integrated Methodology and Case Study,IEEE Transactions On Systems,Man,and Cybernetics,1998,28(3):288-305.

[3] Adem Karahoca.Random Neural Network Approach in Distributed Database Management Systems,2002.

猜你喜欢
神经元网络分片代价
上下分片與詞的時空佈局
分片光滑边值问题的再生核方法
CDN存量MP4视频播放优化方法
ML神经元网络自适应同步的抗扰特性研究
基于模糊二分查找的帧分片算法设计与实现
爱的代价
代价
基于改进PID神经元网络的多变量系统控制算法
模块神经元网络中耦合时滞诱导的簇同步转迁*
成熟的代价