基于语音权重的关系数据库水印算法研究

2011-10-24 05:04:30高智贤张业宏
中国现代教育装备 2011年19期
关键词:关系数据库元组加密

高智贤 张业宏

新乡医学院 河南新乡 453003

基于语音权重的关系数据库水印算法研究

高智贤 张业宏

新乡医学院 河南新乡 453003

阐述了水印关系数据库在数据阻盗版中的需要,明确了对水印技术提出挑战的关系型数据的特点。创造性地提出了一个新型的方法,为关系型数据库产生水印,根据分配的权重不同,把语音信号嵌入到数据库中作为水印。实验结果表明在各种不同的攻击下该方案是健壮的。该方法更加直接,并支持简单的水印识别。

水印关系数据库;版权保护;信息隐藏

水印技术作为一个所有权保护的手段被广泛应用在多媒体技术中。关系数据库越来越广泛地应用产生了一种对于这种技术的类似需求,将数据库和这些数据库的所有者关联起来。水印的主要思路是引入微小的错误作为水印。我们可以通过在关系型数据库中嵌入数字水印解决这个问题,但目前与此相关的研究并不多。水印关系数据库在数据库和信息隐藏两个领域中都变成了重要课题。

我们为关系型数据库提出一种新方案,以音频信号作为水印源信号。用混沌信号加密的音频信号根据不同权重作为版权信息嵌入数值中。作为生物识别特征,语音是固有的,并且不随时间而改变。我们可以利用语音特征和含义得出版权信息。

1 水印关系型数据库的语音算法

水印的主要思路是给数据引入微小的冗余。设计一个特殊的算法机制保护相关数据是有必要的。假定数据库的关系可以通过某些属性做标记,这些改变不会影响其他应用。我们知道在数据库(特别是大型数据库中)具有很多属性,针对不同的应用目的这些属性的重要性不尽相同。为了保证数据集的一致,一个属性越是重要,它就越不能被改动。所以我们提出了一种技术,根据不同的可能权重为某一个属性加水印。

我们的技术目标是根据权值标记数值大小。水印相关型数据库的模型描述如下,如果R是一个关系,用P来表示它的关键属性,A0,…,Ai-1来表示它的其他属性。我们为每一个数据库的所有者赋一个权值,表示为W0,W1,…,Wi-1(Σwi=1, i∈[0,i-1]).在关系R中元组t的属性A被标记为t.A,用符号t.A[i]可以访问t.A的第i个元素。关系R包括η个元组,还有一个关系因子ω=1/α,可以用来做水印。假设允许在一个小数值(1/α)中改变最低ξ位中的一个。数据所有者负责决策哪个属性适用于加水印,并且给出每一个可标记属性。同时也要帮着去决定两个重要的参数ξ和γ,它们是用来描述对一个数据库的修改权限的。

我们将嵌入版权信息在一些实数属性中。使用加密的特征语音激发水印产生算法器产生水印,然后进行相关的插入和检测算法。因为每一个人的语音都具有与其他人相比很独特且长期不会改变的特征,所以我们选择语音信号作为水印。

2 水印产生算法

过程包括3部分:压缩语音信号,增强语音信号,使用混沌信号加密水印。

水印信号的产生过程如下:(1)记录下数据库所有者语音信号片段,我们在不影响应用目的的前提下引入微小的错误信号(这个标记不能影响数据的应用,因此水印信号必须很小)。于是,由于信息量的庞大,语音信号需要压缩。我们使用小波来实验压缩。(2)语音信号增强。我们使用频谱去噪来实现这个目的。这种技术执行在频域并且假定输入信号的频谱可以表示为语音信号和噪音信号的和。过程包括两个难点:评估背景噪音信号的频谱;从语音信号中减掉噪声的频率。(3)加密水印。我们把信号转变为8位A律信号。在我们的机制中,使用Logistic混沌系统加密所有者的语音信号序列。混沌模型通过单向散列函数来加密一些属性。因此,通过使用混沌模型,水印系统的安全性可以加强。作为随机序列产生器,Logistic方程为:Xn+1=μXn(1-Xn){μ∈[1,4] n=0,1,2,…},设算式中μ=4。我们选择一个阈值Q值变化的混沌序列的二进制序列P(I),所有者的语音信号加密为E(i) =W(i)⊕P(i),i=1,2,…,n.⊕=XOR。Logistic的混沌系统重复这个过程直到B={B1,B2,…,BN×N}中的每一个元素都被加密。当每一个元素都被加密时,我们设定加密后集合为E={E1,E2,…,EN×N}。

3 插值算法

把有意义的水印M(平面水印)转变成具有一定长度的比特流E(EMC,加密标记代码)。单向散列函数(例如MD5)的H在我们的算法里至关重要。我们使用单向散列函数来决定哪些元组要标记。同样的方法用来决定哪一位是要标记的。至于属性,我们使用一个权值越大标记值越大的算法为每一个元组标记权限。由于散列结果预计要均匀分布,我们可以将其划分成不同的组,各组大小类似,从而得到L组。水印的第i位将被插入到第i组。I升序的范围从0到mark_length-1水印顺序自然保留。这在检测阶段很有用。水印插入算法如下:

// 加权水印算法,返回标记R

// Hi 是单向散列函数, L是EMC的长度

// 参数 k, L, α, ξ和ν私有

1 E[L]=H(k concatenate M) // 计算L-bit EMC

2 for each tuple r∈R do

3 t= H1( k concatenate r.P)

4 if ( t mod γ equals 0) then // 标记这个元组

5 i = select_attribute() // mark i-th attribute

6 j = t mod ξ // mark j th bit

7 k= t mod L //use the k-th bit of EMC

8 m=Ek XOR (k mod 2) // value of marked bit

9 set the j-th LSB of r.Ai to m

10 return R

11 procedure select_attribute()

12 u= H2( k concatenate r.P)

13 d=Σ(1/ Wi) i∈[0,i-1]

14 if (u mod d) ∈(Σ(1/ Wi-1),Σ(1/ Wi]

15 then return i // W-1=0

4 检测算法

由于同分布的哈希函数,当由相同密钥进行种子生成时,插入算法中各组被选择的元组序列相同。对于同一顺序每个标记位,我们把它的值的计数为0或者为1,然后一个多数表决机制将决定这一位最终的值。检测到的结果是一个二进制序列,其中包括DataSet的版权信息。我们的二进制序列可以转换回语音信号,因此,版权所有者可以利用语音的特征来证明版权。水印检测算法如下:

1 for s=0 to L-1 do

2 DM[s]=’’ // initialize detected mark code

3 count[s][0]=0, count[s][1]=0 // initialize counter

许多学生能说出“膜的主要成份是磷脂和蛋白质”,但对于不同的细胞功能与其膜上载体、糖蛋白特点没能建立起联系,知识是点状,碎片化的,缺乏系统观。

4 foreach tuple r∈R do

5 t= H1( k concatenate r.P)

6 if ( t mod γ equals 0) then // select this tuple

7 i = select_attribute() // mark i-th attribute

8 j = t mod ξ // select j-th bit

9 k= t mod L // mark the k-th bit of EMC

11 count[k][m]=count[k][m]+1 // add the counter

12 for s=0 to L-1 // get the watermark

13 if (count[s][0]>=count[s][1]) // majority voting

14 then DM[s]=0 else DM[s]=1 //the f nal bit value

15 return DM[ ]

5 实验和结果

为了检验该算法的有效性和鲁棒性,我们在2.4GHz CPU,512MB的RAM的Windows XP计算机上执行程序进行实验。由于我们的算法是面向属性的,因而测试方法也面向属性。算法使用Java的Eclipse平台版本3.0,使用ODBC连接访问Microsoft off ce access 2003数据库。应用我们的算法生成的数据,具有5个属性,权值分别为0.4,0.3,0.2,0.05和0.05。生成的记录大小为24000。我们选择MD5作为单向散列函数。子集选择攻击算法,攻击者试图细分元组或者属性来破坏水印。我们选择不同比例的原始数据来模拟这种攻击,该标记的长度是64位,频率分子(ω/L)为5。图1给出了水印检测率攻击发生时,子集选择。

图1 子集攻击选择结果

子集附加攻击:在这一部分,攻击者随机选择了被标记水印的关系部分,将他们和相似不带水印的元组混合形成新的关系,新关系尺寸和原来的尺寸大致相同。结果如图2所示。

图2 子集附加攻击的结果

亚群的变化攻击:在这一部分,攻击者修改了一些显著的关系元组擦除水印。或者是重置每个攻击位为相反位或者是随机重置每个攻击位。与非加权算法的比较,亚群攻击的变化如图3所示。

图3 亚群的变化攻击

6 结束语

随着数据库安全的升级,迫切需要解决关系数据库的版权问题。我们提出了一个新颖的关系型数据库的数字水印产生方法,使用语音信号根据属性的权重将水印嵌入数据库。此外,我们提出了安全性分析,以显示我们的技术应对各种攻击的健壮性。通过实验,结果表明,使用图像特征给关系数据库增加水印的方法是正确的,可行的。这也意味着我们方法的安全性优于以前的算法。

我们利用语音信号保护关系型数据库版权的方法仅研究了数值属性,今后,要将研究扩展到非数值属性领域。由于关系数据的特殊性,在水印关系数据库中进行深入研究有一些困难。但是,关系数据库管理与水印著作权将会是数据库研究的重要课题。本研究方向将会获得越来越多的密切关注。

[1] R.Agrawal, J.Kieman. Watermarking Relational Databases[C]. Proceedings of the 28th VLDB Conference. Hong Kong, China,2002

[2] Radu, S., Mikhail, A., Sunil, P.: Rights Protection for Relational Data [C].Proceedings of ACM SIGMOD,2003

[3] N.Xiamu, Z.Liang, H.Wenjun, "Watermarking Relational Databases for Ownership rotection" [J]. Chinese of Journal Electronics,2003

[4] Z.Zhi-Hao, J.XiaoMing, W.JianMing, "Watermarking relational database using image" [C]. Proceedings of the 3rd International Conference on Machine Learning and Cybernetics. Shanghai,2004

[5] H.Zhongyan, C.Zaihui, S.Jianhua. "An image based algorithm for watermarking relational databases"[C]. 2009 International Conference on Measuring Technology and Mechatronics Automation,2009

[6] S.Jianhua, C.Zaihui, H.Zhongyan. "Multiple Watermarking Relational Databases Using Image"[C]. 2008 International Conference on MultiMedia and Information Technology. Hong Kong, China

[7] C.Xinchun, Q.Xialin, G.Zhijin. "Weighted algorithm for fingerprinting relational database"[J]. Transactions of Nanjing University of Aeronautics & Astronautics,2009

[8] L.S.Wang, S. Deng, R. Shao, A Block Oriented Fingerprinting Scheme in Relational Database[C]. Proc. Seventh Ann. Int’l Conf. Information Security and Cryptology (ICISC2004) (2004),p455

Speech algorithm for watermarking relational databases based on weighted

Gao Zhixian, Zhang Yehong
Xinxiang medical university, Xinxiang, 453003, China

We enunciate the need for watermarking database relations to deter data piracy, identify the characteristics of relational data that pose unique challenges for watermarking. This paper creatively proposes a novel method for watermarking relational database, which uses speech signal as watermark embed into database according to the weight of attributes. Experimental results show that the proposed scheme is robust against various forms of attacks. Our approach is more intuitive, and it support easy watermark identif cation.

watermarking relational databases; copyright protection; information hiding

2011-03-30 稿件编号:1103211

高智贤,本科,助教。张业宏,本科,助教。

猜你喜欢
关系数据库元组加密
关系数据库在高炉数据采集系统中的应用
山东冶金(2022年2期)2022-08-08 01:51:30
Python核心语法
电脑报(2021年14期)2021-06-28 10:46:22
一种基于熵的混沌加密小波变换水印算法
海量数据上有效的top-kSkyline查询算法*
基于减少检索的负表约束优化算法
认证加密的研究进展
基于索引结构的关系数据库关键词检索
基于ECC加密的电子商务系统
基于格的公钥加密与证书基加密
面向数据流处理的元组跟踪方法
电信科学(2013年10期)2013-08-10 03:41:54