关于随机变量差的模函数分布

2022-11-23 02:56叶瑞松陈月明
关键词:连续型均匀分布明文

叶瑞松,李 泓,陈月明

(汕头大学数学系,汕头 广东 515063)

0 引言

在随机数学的教学和研究中,随机变量的函数的分布以及概率的计算是比较复杂的问题.大多数学生对这部分内容的学习常常费力而且学习效果不佳,这其中的客观原因主要有两个因素.一方面,两个一维连续型随机变量的函数的分布及其概率的计算过程常常涉及复杂的二重积分计算;另一方面,传统教材上的演示例子大都脱离实际,与实际的工程问题相离甚远,学生在学习过程未能感受其实在的应用背景和应用价值,学习上提不起兴趣和动力.作者多年从事图像信息安全领域的研究,常常碰到一些涉及随机变量的函数问题,而文献上对这些函数的理论研究欠缺,特别对连续型的数学问题没有系统的理论指导.针对上述的研究和教学中碰到的问题,本文将对两个一维随机变量差的模函数作系统的探讨,分别计算了连续型的概率密度函数和离散型的分布律.

虽然很多大学概率统计的教材上介绍了两个随机变量的和,积,商以及最大值、最小值这些函数的分布和概率计算,但是很多教材并未介绍两个随机变量的差这个函数,更未涉及到两个随机变量差的模函数.两个随机变量的差函数可以变成两个随机变量的和函数来处理,转了个弯,最终还是可以得到相应的分布及概率[1-6].两个随机变量的差函数不是本文所要讨论的函数,我们这里要研究两个随机变量差的模函数的分布和概率计算问题.这个模函数来源于信息科学中图像信息安全研究中的加密算法的设计,有深刻的应用背景[7-9].本文对其做比较系统的研究,有助于对加密算法设计中加密系统的两个随机变量差的模函数运算的数学原理的理解和掌握.实际上,在工程应用中碰到的随机变量问题均是离散型的,但是也有必要对其连续型的情况做理论上的探讨,进一步提升学生的理论素养.论文从理论上得到了离散型和连续型两种情况下的分布函数相关结果,介绍了这个函数在图像处理领域的一个具体应用,并用实例验证了相关的理论结果.

1 随机变量差的模函数

我们将对随机变量X,Y的类型做些限制后,分别得到在不同场合的两个随机变量之差的模函数的分布.模函数mod(s,t)是一个二元函数,当两个自变量均是整数时,模函数就是求余数.当两个变量是一般的实数时,表示取模,返回余数,具体地讲,就是将s写成t与一个整数k的乘积和一个落在[0,t)之间的余数之和的形式s=kt+r,那么mod(s,t)的函数值就是 r.

我们先假设连续型随机变量X,Y相互独立,服从相同的均匀分布,X,Y~U(0,1).求Z=mod(X-Y,1)的概率密度函数.下面给出两种证明方法.一种是直接从概率的概念出发来证明,这对理解概率的基本概念是很有好处的,特别适合教学.另一种是将随机变量差看成随机变量和来处理,再应用随机变量和函数的有关结论,进行证明.后一种方法更具有数学理论的传承和系统性意义.

定理1假设连续型随机变量X,Y相互独立,服从相同的均匀分布,X,Y~U(0,1).则 Z=mod(X-Y,1)服从均匀分布,即 Z~U[0,1).

证明1由于X,Y相互独立,且服从相同的均匀分布U(0,1),其概率密度函数为

所以二维随机变量(X,Y)的联合概率密度函数为

而 Z=mod(X-Y,1)的取值在[0,1),假设 Z 的分布函数为 F(z),则

1)对任意的z≥1,F(z)=P(Z≤z}=1.

2)对任意的z≤0,F(z)=P(Z≤z}=0.

3)对任意的0≤z<1,由图1知道

图1 两个连续型随机变量差的模函数分布的计算示意图

其中当0≤z<1时,分布函数的计算中涉及的区域Ω1,Ω2可以参看图1.从计算所得知道 Z~U[0,1).

证明2 X,Y相互独立,从而X,W=-Y也相互独立,从而Z=mod(X-Y,1)可以看成Z=mod(X+W,1),此时W=-Y~U(-1,0),因此问题变成证明两个相互独立的随机变量之和的模函数分布问题,这问题在文献[9]的定理5已经解决,所以转了个弯,也获得了证明.

将随机变量离散化,得到两个随机变量差的模函数的离散型问题,其结果可以用到数字图像的加密领域中涉及两幅图像差的模函数.一般来讲,加密过程设计两个随机变量和的模函数,可以得到很好的加密性能.应用服从均匀分布的密钥流和服从一般分布的明文图像作加法模运算操作,可以实现密文图像具有均匀分布的分布性能[7,9].那么解密过程将涉及两个随机变量差的模函数.由于图像数据可以看作随机变量,其取值为m比特的整数数据,所以在应用中,选取模为2的幂次数2m,其中m为某一个正整数.一幅灰度数字图像的亮度值可以用m比特的整数来表示,m比特的整数随机变量总共可表示2m个不同的值{0,1,2,…,2m-1},也就是说,如果随机变量X,Y表示m比特的图像的亮度,其取值范围就是{0,1,2,…,2m-1}.比如m=8比特的数字图像,有28=256个不同灰度层次.

为了使得结论更具有一般性,我们可以假设灰度图像具有L个灰度级,其灰度值取值为{0,1,2,…,L-1},则可以得到关于离散随机变量的定理2,这是定理1的离散型版本.

定理2假设离散型随机变量X,Y相互独立,服从相同的均匀分布:

则 Z=mod(X-Y,L)的分布和 X,Y 的分布相同.

证 Z=mod(X-Y,L)的取值范围为{0,1,2,…,L-1},所以要得到其分布律,只要计算0≤k≤L-1时,对应的概率P(Z=k}:

所以Z=mod(X-Y,L)服从和X相同的分布.

定理2得到两个一维相互独立的均匀分布随机变量差的模函数的相关结论.在实际应用场合,均匀分布一般对应类似噪声的信号、图像信息.服从均匀分布的随机变量所表示的图像一般是一幅具有明确内容的明文图像经过加密而得到的密文图像.在应用中,很自然会碰到一个问题,就是一幅具有自然内容的明文图像的加密问题,其中一种办法就是改变图像每个像素的亮度值,从而遮掩了自然图像的内容.密码学要求密文图像要接近均匀分布,越逼近均匀分布,加密性能越好.在这种应用背景中,显然明文图像所对应的随机变量不一定是均匀分布,所以有必要对两个随机变量之一不是均匀分布的差的模函数作理论上的探讨.定理3中随机变量X表示某一幅模拟图像的连续型随机变量,其灰度值的范围已经归一化到单位区间[0,1),所以其概率密度函数只是在[0,1)取值,而在[0,1)外的概率密度均为0.定理3同样可以利用文献[9]的定理5加以证明,但是为了有助于教学的深入浅出的目的,本文也列出定理3的证明,供参考.

定理3假设连续型随机变量X,Y相互独立,Y~U[0,1),X的概率密度函数为

则 Z=mod(X-Y,1)的分布也是 U[0,1).

证 Z的取值范围为[0,1),设Z的分布函数为F(z),则

(i)对任意的z≥1,F(z)=P(Z≤z}=1.

(ii)对任意的z<0,F(z)=P(Z≤z}=0.

(iii)对任意的 0≤z<1,

F(z)=P(Z≤z}=P{mod(X-Y,1)≤z}=P{0≤X-Y≤z}+P{X-Y+1≤z,X≤Y}.由于(X,Y)的联合概率密度函数为

和定理1一样,计算当0≤z<1时的分布函数,可以参看图1,但是这里的计算不能使用Ω1,Ω2的面积作为概率值,需要计算其累次积分.

所以和定理1结论一样,Z~U[0,1).

同样将定理3中的随机变量离散化,应用到数字图像处理的领域中,也有相应的离散型的定理4.

定理4假设离散型随机变量X,Y相互独立,Y服从离散均匀分布:

X的分布律为

则Z=mod(X-Y,L)的分布和Y的分布相同,也是离散均匀分布.

证 Z=mod(X-Y,L)的取值范围为{0,1,2,…,L-1},当 0≤k≤L-1 时,

证明完毕.

本文作者在文献[9]讨论了一幅具有某种分布特性的明文图像X和一幅服从均匀分布的密钥流图像Y进行加法模运算Z=mod(X+Y,L)后,将得到服从均匀分布的密文图像Z.如果知道密文图像Z和密钥流图像Y,如何唯一解密获得明文图像X?这就是解密过程,容易验证,在模L意义下,其对应的减法模运算X=mod(Z-Y,L)可以实现可逆的解密.为什么两个服从均匀分布的随机变量Z,Y在做差后的模函数可以得到一个服从一般分布的随机变量X?这个问题好像和定理2的结论有矛盾之处.原因在哪里?我们有必要对这个问题进行更深入的研究.出现矛盾的根源在于加密算法的密文图像Z实际上已经和Y有关系了,Z,Y不再是相互独立的均匀分布的随机变量.所以解密中所用的逆运算,即差的模函数mod(Z-Y,L)已经不能满足定理2的条件了,所以定理2的结论在解密中是不适用的.为了进一步探讨这个问题,我们将不要求相互独立这个条件,并得到下面的定理5.定理5回答了利用随机变量和的模函数的加密运算和解密运算的可逆性问题.

定理5假设离散型随机变量X,Y相互独立,X,Y服从分布如定理4所述,随机变量 Z=mod(X+Y,L),则通过减法模运算 X′=mod(Z-Y,L)得到随机变量 X′具有与 X相同的分布.

证明 显然,现在Z,Y不再是相互独立的均匀分布,所以定理2的结论不适用.我们采用条件分布来证明结果.X′=mod(Z-Y,L)的取值范围仍为{0,1,2,…,L-1},则

所以定理结论成立.

2 应用

数学上,灰度数字图像可以用一个整数值二维矩阵A来表示.如果灰度图像是L=256个灰度级(即8比特)的灰度图像,则A的元素的值属于集合{0,1,…,255}.某个灰度图像可以表达为一个随机变量X生成的样本,图2(a)Lena图像可以看成某个随机变量的一个实现样本,图2(b)为其直方图概率分布.如果Y是取值于{0,1,…,255}的离散均匀分布的随机变量,则Y生成的一个二维矩阵样本B将类似于一幅噪声图像,图3(a)为一幅均匀分布的随机变量生成的噪声图像,图3(b)为其直方图概率分布.两幅图像A,B之和的模函数C=mod(A+B,256),得到图像矩阵C,如图4(a)所示,图4(b)为其对应的直方图概率分布.这个结果的图像实际上可以看成隐藏着明文图像Lena的信息的密文图像,其分布也是离散均匀分布[9].我们用图4(a)的密文图像矩阵和图3(a)的密钥图像矩阵之差的模函数来实现解密,可以无失真地还原原始的明文图像图2(a):A0=mod(C-B,256).解密图像及其直方图概率分布如图5所示.图5(a)-(b)分别和图2(a)-(b)对应,是完全一样的,这从数值实验上进一步验证了定理5的理论结果.这个简单的加密算法和解密算法很容易用matlab实现,代码如下,供参考.

图2 明文图像Lena及其直方图

图3 密钥图像及其直方图

图4 密文图像及其直方图

图5 解密得到的明文图像及其直方图

3 结论

本文根据图像信息安全领域中经常碰到的两幅图像信息之差的模运算的实际问题,探讨了两个一维的相互独立的随机变量X,Y之差的模函数Z=mod(X-Y,L)的分布及其概率计算,证明了相关的理论结果,并提供一个具体的应用例子.该函数的离散型情况具有很强的应用背景,对该函数的介绍以及相关理论的证明可以促进大学生进一步理解和掌握随机变量的模函数的相关知识,也为工程研究人员提供理论指导.具体的信息安全的应用例子必将进一步提高理工科大学生学习概率统计的兴趣和动力.本文结果可以说是体现数学与信息学交叉融合的一个很好的例子,体现了数学的应用价值.这也是一个概率统计的教学和研究相互结合的典型例子,其中的理论部分体现了数学的概率理论之美,数值实验部分则体现了统计计算的实用典范.

猜你喜欢
连续型均匀分布明文
思维建模在连续型随机变量中的应用
连续型美式分期付款看跌期权
奇怪的处罚
电磁感应综合应用检测题
可逆随机数生成器的设计
尼龙纤维分布情况对砂浆性能的影响研究
奇怪的处罚
四部委明文反对垃圾焚烧低价竞争
基于晶圆优先级的连续型Interbay搬运系统性能分析
关于二维连续型随机变量函数分布的推广和运算