不确定性原理事实上并不是一个单独的定理,而是一组定理的统称,凡是刻划一个信号不能在时空域和频域上同时过于集中的命题都可以称为不确定性原理,“集中”这一性质可以有不同的数学描述,也就对应了不同的数学定理,但是在所有冠以“不确定性原理”之名的定理中,最著名的当然是由德国物理学家、量子力学的主要创始人海森堡(W,Heisenberg)在1927年提出的、影响了物理学发展的那个版本,它的精确描述是:
假定一个信号的总能量为1.则这个信号和它的傅立叶变换的能量的方差之积不小于1/16π2换言之,两者各自的能量都可能很集中,但是不能同时很集中,如果时空域中能量的方差很小(即集中在一起),那么频域上能量的方差就不会太小(即必然会弥散开),反之亦然。
对这个定理在量子物理学中的意义的讨论超出了本文的话题范围,下面简单罗列一些相关的历史事实:
海森堡在1927年发表了一篇标题为《量子理论运动学和力学的直观内容》的文章,这篇文章很大程度上是对薛定谔(E,Schrodinger)在1926年提出的薛定谔波动方程的回应,相较于海森堡的矩阵力学而言,薛定谔的方程很快由于它物理上的直观明晰而得到了越来越多物理学家的赞赏,海森堡对此感到极为失落,在1926年6月8日写给物理学家泡利(W,Pauli)的信中说:“我对薛定谔的理论想得越多我就越觉得恶心,”因此,他迫切需要给自己的理论配上一个更直观的图象。
海森堡的这篇文章给出了后来被人们所熟悉的有关为什么无法同时测量一个电子的位置和动量问题的解释,但是并未给出任何严格的数学证明,他把他的结论笼统地表达为△x △p≥h,其中x是位置,p是动量,h是普朗克常数,但他并没有详细说明△x和△p的意思,只针对若干具体情形作了一些直观的讨论。
第一个从数学上证明不确定性原理的是物理学家E,Kennard,他在1927年证明了文章开头所描述的定理,指出△x和△p的数学意义其实是方差,这种解释很快就成了海森堡不确定性原理的标准数学表达,海森堡于1930年在芝加哥的演讲中也用了这种数学推导,来佐证他的立论,需要说明的是,海森堡尽管很快接受了这一数学解释,但是后来人们发现在他本人原先的论文里所举的那些例子中,有很多被他用△x和△p笼统概括的含混概念其实是无法被解释成方差的,在他的心目中,不确定性原理首先是一个经验事实,其次才是一个数学定理,
海森堡并未将他的发现命名为不确定性“原理”,而只是称为一种“关系”,英国天文学家、数学家爱丁顿(A,Eddington)在1928年似乎第一个使用了“原理”一词,将之称为principle of indeterminacy,后来uncer-tainty principle这种说法才渐渐流行起来,海森堡本人始终称之为ungenauigkeitsrelationen/unbestim-mtheitsrelationen(相当于英语的inaccuraey/indetermi-nacy relations),直到20世纪50年代才第一次接受了principle这种称呼。
有趣的是,即使很多信号处理或者量子力学领域的专家也不知道自己平时所讨论的不确定性原理和对方所讲的其实是一回事,两者之间的联系的确并不太明显,一个关注信号的时空和频域分布,一个关注粒子的运动和能量,它们之间的相关性只有从数学公式上才看起来比较明显,在海森堡的时代当然并不存在“信号处理”这一学科,数学家们也只把不确定性原理当作一个纯数学的结论来对待,他们什么时候最先注意到这一定理并不是很清楚,有记录表明美国应用数学家维纳(N,Wienerl 1925年在哥廷根的一次讲座中提到了类似的结论,但是那次讲座并没有任何书面材料留存下来,德国数学家外尔(H,Weyl)在1928年名为《群论与量子力学》的论著中证明了这一定理,但他将之归功于泡利的发现,直到1946年,英国的加博(D,Gabor)发表了一篇名为《通讯理论》的经典论文,才真正让这个定理以今天信号处理领域的专家们所熟悉的方式流传开来。
正如前面所說过的那样,在数学上,不确定性原理不仅仅有海森堡这一个版本,它其实是一组定理的统称,譬如哈代(G,Hardy)在1933年证明了一个和海森堡原理类似的定理,今天一般称之为哈代不确定性原理,海森堡和哈代的定理都只约束了信号在时空域和频域的大致分布,并没有限制它们同时集中在有限大的区域内,M,Benedicks第一个证明了信号在时空域和频域中确实不能同时集中在有限大的区域内,而这已经是1974年的事情了。
到20世纪末,人们对“信号”这个词的理解已经有了微妙的变化,如果在20世纪上半叶的时候提到一个信号,人们还倾向于将它理解为一个连续的函数,而到了下半叶,信号已经越来越多地对应于一个离散的数组,毫无疑问,这是电子计算机革命的结果。
在这样的背景下,“不确定性原理”也有了新的形式,在连续情形下,我们可以讨论一个信号是否集中在某个区域内;而在离散情形下,重要的问题变成了信号是否集中在某些离散的位置上,而在其余位置上是零,数学家给出了以下有趣的定理:
一个长度为Ⅳ的离散信号中有a个非零数值,而它的傅立叶变换中有b个非零数值,那么a+b≥2根号N,也就是说一个信号和它的傅立叶变换中的非零元素不能都太少,毫无疑问,这也是某种新形式的“不确定性原理”。
在上面的定理中,如果已知Ⅳ是素数,那么我们得出以下结论:
—个长度为素数N的离散信号中有a个非零数值,而它的傅立叶变换中有6个非零数值,那么n+b>N。
不幸的是,这里“素数”的条件是必须的,对于非素数来说,第二条命题很容易找到反例,这时第一条命题已经是能够得到的最好结果了。
这些定理有什么用呢?如果它仅仅能用来说明某些事情做不到,就像它字面意思所反映出的那样,它的用处当然是相对有限的,可这无疑是辩证法的一个好例证,这样一系列宣称“不确定”的定理,事实上是能够用来推出某些“确定”的事实的。
设想这样一种情况:假定我们知道一个信号的总长度为Ⅳ,已知其中有很大一部分值是零,但是不知道是哪一部分(这是很常见的情形,大多数信号都是如此),与此同时,我们测量出了这个信号在频域空间中的K个频率值,但是K
按照传统的信号处理理论,这是不可能的,因为正如前面所说的那样,频域空间和原本的时空域相比,信息量是一样多的,所以要还原出全部信号,必须知道全部的频域信息,就像要解出多少个未知数就需要多少个方程一样,如果只知道一部分频域信息,就像只知道K个方程,却要解出Ⅳ个未知数来,任何一个学过初等代数的人都知道,既然K
但是借助不确定性原理,却可以做到这一点,原因是我们关于原信号有一个“很多位置是零”的假设,那么,假如有两个不同的信号碰巧具有相同的K个频率值,那么这两个信号的差的傅立叶变换在这K个频率位置上就是零,另一方面,因为两个不同的信号在原本的时空域都有很多值是零,它们的差必然在时空域也包含很多零,不确定性原理(一个函数不能在频域和时空域都包含很多零)告诉我们,这是不可能的,于是,原信号事实上是唯一确定的!
这当然是一个非常违反直觉的结论,它说明在特定的情况下,我们可以用较少的方程解出较多的未知数来,这在应用上极为重要,比如医学核磁共振技术,核磁共振成像本质上就是采集身体图像的频域信息来还原空间信息,由于采集的成本很高,所以核磁共振成像很昂贵,也很消耗资源,但是上述推理说明,事实上核磁共振可以只采集一少部分频域信息(这样成本更低、速度也更快),就能完好还原出全部身体图像,这在医学上的价值是不可估量的。
今天,类似的思想已经被应用到很多不同的领域,从医学上的核磁共振和x光断层扫描到石油勘测和卫星遥感,简言之:不确定性可以让测量的成本更低、效果更好,虽然这听起来自相矛盾。
这里的“极大概率”并不是一个生活用语,而是一个关于具体概率的精确的数学描述,换言之,虽然在最倒霉的情况下不确定性可以比较小,但是这种情况很罕见,一般来说,不确定性总是很大,于是,可以節约测量的成本。
这当然也是一种“不确定性原理”,而且因为引入了随机性,所以在某种意义上来说比原先的定理更“不确定”,在他们工作的基础上,一种被称为“压缩感知”的技术在最近五六年的时间内很快发展起来,成为涵盖信号处理、信息提取、医学成像等多个工程领域最重要的新兴工程技术之一。
不过,这些后续的应用和发展估计远远超出海森堡的本意了。