量子信息中的熵不等式

2018-06-30 07:40刘波
考试周刊 2018年51期
关键词:概率分布算子量子

摘要:设ρ和σ是表示量子状态的两个密度算子(迹为1的半正定算子),定义ρ到σ的相对熵为S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)。分别应用密度算子的标准正交分解和凹函数的相关知识证明了S(ρ‖σ)≥0,同时把凹函数定义推广到矩阵的迹形式。

关键词:密度矩阵;量子的相对熵;迹

一、 引入

在经典信息论中,设系统X={(xi,p(xi))},i=1,…,n,随机变量Shannon熵可以定义为随机变量取不同值的一个函数,可以看作是概率分布的函数。

定义1设X={(xi,p(xi))},i=1,…,n为一个系统,Shannon熵定义为H(X)=H(p1,…,pn)≡-∑ni=1(pxlogpx),本文中“log”是以2为底的,“ln”是自然对数,因为log0没有定义,从直观上讲,不发生事件对Shannon熵没有贡献,因此可规定0log0=0。

定义2设p(x)和q(x)是定义在同一指标集上的概率分布,p(x)到q(x)的相对熵定义H(p(x)‖q(x))≡-∑xp(x)logq(x)p(x),定义当p(x)>0时,-p(x)log0=+∞。

定理1设p(x)和q(x)是定义在同一指标集上的概率分布,则p(x)到q(x)的相对熵是非负的,即H(q(x)‖p(x))≥0,当且仅当p(x)=q(x)时等号成立。

证明对所有的正整数x>0,logxln2=lnx≤x-1当且仅当x=1时等号成立。那么其可以变形为-logx≥1-xln2,H(q(x)‖p(x))≡-∑xp(x)logq(x)p(x)≥1ln2∑xp(x)1-q(x)p(x)=1ln2∑x(p(x)-q(x))=1ln2(1-1)=0。由上面的可知,当且仅当p(x)=q(x)对所有的x成立时取等号。

Shannon熵测量的不确定性与经典概率的分布相关联。描述量子状态的方式是类似的,只是用密度算子代替概率分布,把Shannon熵推广到量子状态。以下把量子状态下的相对熵的非负性证明做一些讨论。

二、 内容

定义3设pi是量子系统中一组状态|ψi〉对应的概率,称ρ=∑ipi|ψi〉〈ψi|为一个纯态系统的密度算子(或者成为密度矩阵)。

定理2密度算子ρ=∑ipi|ψi〉〈ψi|是一个迹为1的半正定算子。

证明因为ρ=∑ipi|ψi〉〈ψi|,所以tr(ρ)=tr(∑iρi|ψi〉〈ψi|)=∑iρitr(|ψi〉〈ψi|)=∑iρi=1,且对于任意的一个表示状态的向量|φ〉,〈φ|ρ|φ〉=〈φ|∑iρi|ψi〉〈ψi||φ〉=∑iρi〈φ,ψi〉〈ψi,φ〉=∑iρi〈ψi,φ〉2≥0

定理3一个迹为1的半正定算子ρ一定是一个密度算子。

证明因为ρ是一个半正定算子,所以ρ一定有谱分解。ρ=∑iλi|i〉〈i|,其中λi是半正定算子的非负特征值,向量组|i〉是正交的,又因为∑iλi=1,所以以λi为一组状态|i〉对应的概率的量子系统存在密度算子。

定义4设ρ是表示量子状态的密度算子,(即Von Neumann熵)定义量子状态下的熵为S(ρ)=-tr(ρlogρ)。如果λx是ρ的特征值,那么定义可以写成S(ρ)=-∑xλxlogλx

定义5设ρ和σ是表示量子状态的两个密度算子,那么ρ到σ的相对熵定义为S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)

定理4设ρ和σ是密度算子,那么S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)≥0,其中ρ=σ时等号成立。

证明令ρ=∑ipi|i〉〈i|和σ=∑jpj|j〉〈j|分别为ρ和σ的标准正交分解,那么有tr(ρlogρ)-tr(ρlogσ)=∑ipilogpi-∑〈i|ρlogσ|i〉,因为〈i|ρ=pi〈i|,并且〈i|logσ|i〉=〈i|(∑jlog(qj)|j〉〈j|)|i〉=∑log(qj)pij,其中pij=〈i||j〉〈j||i≥0〉,由此可得S(ρ‖σ)=∑ipi(logpi-∑jpijlogqj),其中pij≥0,并且∑ipij=1,∑jpij=1。由于log(·)是严格的凹函数,所以∑jpijlogqj≤logri,其中ri=∑jpijqj,当且仅当存在某个j,使得pij=1时等号成立,于是S(ρ‖σ)≥∑ipilogpiri,当且仅当对于每一个i都存在一个j使得pij=1时取等号。即当且仅当pij是置换阵,由经典相对熵的非负性,即定理1可知S(ρ‖σ)≥0。

定理4的又一个证明要用到以下知识。

定义5设f(x)是关于实数变量x的可微实函数,如果对于所有的x和y,都有f(y)-f(x)≤(y-x)f′(x)成立,那么函数f(x)是凹的。

例如,设函数f(x)=-xlogx,当x>0时就是凹的,因为将它代入上式中,整理可得logxy≤xy-1,此式当x>y>0时成立,因为对x>0,有不等式log(1+x)

可将上面的定义推广到矩阵求迹形式,可以得到以下定理。

定理5设ρ和σ是两个n维矩阵,且不一定对易(如果ρσ=σρ,那么就称n维矩阵ρ和σ是对易的),如果f(x)是一个凹函数,那么tr[f(σ)-f(ρ)]≤tr[(σ-ρ)f′(ρ)]。

证明设ρ和σ的特征值分别为α1,α2,…,αn和β1,β2,…,βn,将这两组数按降幂排列,得到新的两组数α′1,α′2,…,α′n和β′1,β′2,…,β′n,于是令定义2中的x和y分别取这里的α′i和β′i,利用函数的凹性,有

f(β′1)-f(α′1)≤(β′1-α′1)f(α′1)

f(β′n)-f(α′n)≤(β′n-α′n)f(α′n)

将这n个方程求和,注意有

∑ni=1f(α′i)=∑ni=1f(αi)=trf(ρ)

∑ni=1f(β′i)=∑ni=1f(βi)=trf(σ)

∑ni=1α′if′(α′i)=∑ni=1αif′(αi)=tr[ρf′(ρ)]

∑ni=1β′if′(α′i)=∑ni=1βif′(αi)=tr[σf′(ρ)]

因此可得tr[f(σ)-f(ρ)]≤tr[(σ-ρ)f′(ρ)]。

现在可以利用定理5给出定理4的另一种证明。

证明对于任意两个表示量子状态的密度算子ρ和σ,定义f(ρ)≡-ρlogρ和f(σ)≡-ρlogσ,利用定理3,有-S(ρ‖σ)=tr[-ρ(logρ-logσ)]=tr[f(ρ)-f(σ)+f(σ)+ρlogσ]≤tr[(ρ-σ)(-logσ-1)-(σ-ρ)logσ]=tr(σ-ρ)=0。

所以S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)≥0。

參考文献:

[1]Michael A. Nielsen, Isaac L. Chuang著,赵千川译.量子计算和量子信息[G].清华大学出版社,2004.

[2]Stephen M. Barnett, Quantum information, Oxford Master series in atomic, optical, and laser physics.

[3]A. S. Holevo, Reliability function of general classicalquantum channel. IEEE Trans. Inform. Theory 46,2000:2256-2261.

[4]T. Ogawa, H. agaoka, Strong converse to the quantum channel coding theorem, IEEE Trans. Inform. theory,1999(45):149-154.

作者简介:

刘波,讲师,陕西省西安市,陕西学前师范学院理学。

猜你喜欢
概率分布算子量子
2022年诺贝尔物理学奖 从量子纠缠到量子通信
拟微分算子在Hp(ω)上的有界性
离散型概率分布的ORB图像特征点误匹配剔除算法
各向异性次Laplace算子和拟p-次Laplace算子的Picone恒等式及其应用
决定未来的量子计算
新量子通信线路保障网络安全
一类Markov模算子半群与相应的算子值Dirichlet型刻画
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
一种简便的超声分散法制备碳量子点及表征