基于互信息的高斯指纹方案

2014-04-29 06:09:35程格平
计算机时代 2014年8期

程格平

摘 要: 在高斯指纹系统中,指纹的嵌入与检测须服从均方失真限制,以获得较好的保真度。根据概率统计理论,分析了基于阈值相关检测的传统指纹方案中指纹编码速率、均方失真限制以及共谋人数之间的关系,并指出阈值相关检测方法的缺点,即当编码速率大于容量范围的某个值时检测器性能较差。为了解决容量限制的问题,提出一种在限定均方误差的条件下取得数字指纹基本容量的高斯指纹方案。利用互信息游戏理论,提出最大惩罚高斯互信息的指纹检测方法,有效地解决了传统指纹检测方法存在的问题。根据指纹容量的数学模型,推导出指纹容量的表达式。

关键词: 高斯指纹; 互信息理论; 指纹检测; 指纹容量

中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2014)08-40-03

Gaussian fingerprinting scheme based on mutual information

Cheng Geping

(School of Mathematical and Computer Sciences, Hubei University of Arts and Science, Xiangyang, Hubei 441053, China)

Abstract: In Gaussian fingerprinting system, fingerprinting encoder and decoder must obey mean-squared distortion constraints to obtain better fidelity. According to the theory of probability and statistics, the fingerprinting code rate is analyzed with mean-squared distortion on constraint and the number of colluders on account of the normalized threshold decoder. The disadvantage of traditional fingerprinting decoding method by correlation decoder which has poor decoding performance when code rates greater than some value of capacity is introduced. To solve this problem, a Gaussian fingerprint scheme is proposed to achieve the fundamental capacity limits of digital fingerprint under the definite mean-squared distortion. By means of mutual-information game, the decoding method of maximum penalized Gaussian mutual information is presented. In the end, the expression of fingerprinting capacity is derived from the mathematical model.

Key words: Gaussian fingerprint; mutual-information theory; fingerprinting decoder; fingerprinting capacity

0 引言

數字指纹能够用于叛逆者追踪和版权保护。发行商将用户指纹嵌入在数字产品中,然后分发给每个授权用户,然而如果其中一组用户联合起来进行共谋,通过处理他们的合法拷贝就可以生成一个包含共谋用户弱指纹信息的伪本[1]。为了解决这个问题,COX[2]等首先提出使用随机选取且服从独立同分布的高斯指纹作为用户指纹,检测时使用不公开的用户指纹码来追踪共谋者,达到抵抗共谋攻击的目的。

在共谋过程中,共谋者可能对他们的指纹拷贝采用线性攻击、高斯噪声和非线性攻击策略。因此,共谋者检测的基本问题是如何优化指纹系统的检测性能。为了解决这个问题,本文假设指纹嵌入和共谋引起的失真在一定的限制范围,有文献对基于有限字母表[3]和实数值[4]的指纹信号进行了分析,指出高斯指纹对这些攻击具有较好的抗共谋能力。文献[5]利用互信息理论推导了指纹容量的上界,但没有具体指出如何在欧几里德集合中获取这种界限的编码方案。

基于互信息理论,本文针对高斯指纹模型提出一种指纹编码方案,对检测器性能进行优化,在可靠检测基础上得到指纹编码速率的范围。

1 问题模型

假定检测器已知宿主信号内容和最大共谋人数Kmax,但不知道共谋者所采用的策略和共谋用户人数,检测器能够检测出参与共谋的用户。指纹系统模型可以从以下几个方面进行描述。

1.1 指纹生成和嵌入

假设宿主信号是实数空间上长度为N的一个序列,即,且宿主信号对于共谋者未知。M(M?Kmax)个长度为N的用户指纹形成一个指纹码本C={(U1,…,UM),C∈N},其中Ui=(u1,…,uN)是服从N(0,D1)的随机序列,指纹码的嵌入率为。嵌入指纹后第m个用户的指纹拷贝可表示为:

Xm=S+Um, m∈{1,…,M} ⑴

码本C独立于宿主信号S。由此可得,即指纹信号的均方失真为D1。

1.2 攻击模型

假定K(K?M)个共谋者选择的无记忆性共谋通道为A(y|xk),以加入均值为0方差为D2的加性高斯噪声的平均攻击为例,共谋者联合他们的拷贝经过攻击通道生成的共谋伪本Y可表示为:

其中W~N(0,D2)。共谋通道A须满足式⑶两个限制条件,即

局部不变限制:A(y|xk)=A(y-s|(x-s)k)

均方失真限制:

局部不变限制不需要考虑宿主信号S的统计模型,排除对宿主信号的过滤攻击,简化了数学推导过程。如果指纹嵌入在分量近似独立且与嵌入失真相关的宿主信号变换域,则此限定条件更加宽泛。均方失真限制条件表明失真是度量指纹信号质量的标准,用线性无偏估计量表示,其最大值为D2。另外,最优的共谋攻击须满足可行性和公平性,即A(y|xπk)=A(y|xk),π为置换不变性因子,这说明共谋集合中所有成员必须承担同样的风险。

1.3 检测器模型

在指纹检测过程中,宿主信号对检测器是有效的。指纹检测器输出估计的共谋者集合,即:

其中,gN为独立于S的检测函数。如果检测器输出的集合为空集,则表明没有发生共谋。现有文献的指纹检测器多数采用阈值检测统计量进行检测,但这种检测器是次优的。

1.4 错误概率与容量

在共谋攻击通道,基于局部不变限制和均方失真限制的假设,检测器的两种性能标准错误肯定概率(控告一个无辜用户)和错误否定概率(不能抓住共谋者)的定义如下:

在失真限定条件下,如果存在一个码本序列(N,2NR),当N→∞时,错误肯定概率和错误否定概率的利益成本函数近似为零,则指纹容量是所有可得指纹码率R的最小上界,可靠指纹系统的指纹容量由参数(N,M,K,D1,D2)确定。

基于互信息理论,对Wang和Moulin[6]提出的码率公式进行改进,可得到指纹码率的最大最小值,即:

其中C1(K)?C(K),当且仅当共谋人数K=1时两个值相等。

2 传统阈值检测器

在实空间N上两个随机序列的歸一化相关系统定义为ρ(x,y)=,阈值为η的阈值检测器满足以下条件:

共谋攻击后指纹信号和共谋伪本的归一化相关系数概率收敛于:

假设对于任意小的正数ε,存在η=η1(Kmax)-ε。

下面对错误肯定概率和错误否定概率进行分析。

2.1 错误否定概率

根据上述条件可以得到随机变量和的概率收敛到其期望值,分别为和。在共谋通道A,ρ(Xm,Y)最大值也是概率收敛的,即maxm∈Kρ(Xm,Y)?η1(K)?η+ε。因此,错误否定概率的概率分布可表示为:

2.2 错误肯定概率

对于任何不在共谋集中的无辜用户,Xm和Y相互独立。由香农公式可得错误肯定概率的概率分布:

其中,。

由于ε是任意小的正数,E(η1(Kmax))=C1(Kmax),当码率RC1(Kmax)时,PFP的值近似为1,这表明,对这些码率值检测器不能可靠地检测到共谋指纹。

3 基于互信息理论的检测器

阈值检测器的基本思想是,针对个体共谋成员的决策方式,当R>C1(Kmax)时,满足条件ρ(Xm,Y)?η1的用户指纹数为,导致虚警率的提高,进而影响指纹检测的可靠性。因此,实现对共谋者集合的联合决策是提高指纹系统检测性能的有效途径。

根据互信息理论,归一化相关系数为ρ的两个高斯随机变量X和Y的互信息为。如果Xk服从独立同分布N(0,D1),W服从N(0,D2)且独立于Xk,,其中,则指纹Xk与共谋伪本Y序列之间的高斯互信息表示为:

(10)

定义为指纹信号Xk的集合,指纹序列Xk的归一化相关性满足以下条件:

(11)

对于固定的K值和任意小ε的随机球形码,根据大数定理,当N→∞时,(11)式具有近似为1的概率。

设τ=C(Kmax)-ε,基于互信息的检测器可表示为:

(12)

检测器的输出值对最大惩罚高斯互信息标准最大化。当N→∞时,随机变量IG(Xk;Y)收敛于其数学期望值,即IG(Xk;Y)?KC(K)。τ的最大值为C(Kmax),因此当指纹码率R小于C(Kmax),检测器能够进行可靠检测。当K→∞时,C1(K)~C(K)~。

结合上述分析,对文献[7]中的定理进行改进即可以得到指纹容量(即指纹编码的最大码率)为KmaxC(Kmax)。

4 结束语

针对指纹编码和检测的均方失真限制,本文基于互信息游戏理论,分析了传统相关性指纹检测方法的缺点。指纹容量是指纹系统的重要性能指标,针对传统阈值检测器存在的容量限制问题,提出一种基于互信息理论的检测方法。通过理论分析,有效获得了指纹编码的可获得最大码率,即指纹容量是指纹系统的最大共谋人数及其互信息值的乘积。可以看出,基于互信息理论的检测方法推导出的指纹容量要高于传统阈值检测器的容量界限。在数字指纹技术的研究领域,理论分析研究方法通常有一定的条件限制,因此,设计更加具有实效性的抗共谋指纹方案是未来指纹研究的发展方向。

参考文献:

[1] 吕述望,王彦,刘振华.数字指纹综述[J].中国科学院研究生院学报,

2004.3:289-298

[2] Cox I J, Kilian J, Leighton F T, et al. Secure spread spectrum

watermarking for multimedia[J]. Image Processing, IEEE Transactions on,1997.6(12):1673-1687

[3] Moulin P, O'Sullivan J A. Information-theoretic analysis of

information hiding[J].Information Theory, IEEE Transactions on,2003.49(3):563-593

[4] Kilian J, Leighton F T, Matheson L R, et al. Resistance of digital

watermarks to collusive attacks[C]//IEEE International Symposium on Information Theory. Institute of Electrical Engineers Inc(IEEE),1998:271-271

[5] Somekh-Baruch A, Merhav N. On the capacity game of private

fingerprinting systems under collusion attacks[J]. Information Theory, IEEE Transactions on,2005.51(3): 884-899

[6] Wang Y, Moulin P. Capacity and optimal collusion attack channels

for Gaussian fingerprinting games[C]//Electronic Imaging 2007. International Society for Optics and Photonics,2007:65050J-65050J-9.

[7] Moulin P. Universal fingerprinting: Capacity and random-coding

exponents[C]//Information Theory, 2008. ISIT 2008. IEEE International Symposium on. IEEE,2008:220-224