杨晓堃 李维 黄永畅
(北京工业大学理论物理研究所,北京 100022)
量子博弈作为一个新兴的研究领域,吸引了广泛的学术关注.在传统的经典博弈理论中,参与者的决策是基于经典概率和策略进行的.然而,随着量子计算的快速发展,科研人员意识到在一些复杂系统中,参与者的行为可能受到量子效应的影响.这引发了研究者对量子博弈理论的兴趣.其中,“PQ”问题作为量子博弈中的一个重要议题,涉及到参与博弈者之间进行策略制定、收益分配以及量子效应对博弈结果的影响.研究此问题具有重要的理论和实践意义.首先,通过深入研究“PQ”问题,可以更好地理解量子效应在博弈理论中的作用,从而揭示复杂系统中参与者行为的量子特性.其次,“PQ”问题的解决方法和算法设计有望为实际应用领域,如信息安全、经济决策和社会科学等提供新的工具和洞见.如今,量子理论[1]和博弈论[2–5]结合在一起,形成了一个新的交叉学科—量子博弈论.
量子硬币翻转(quantum penny flip)是量子力学中的一个重要的思想实验,其展示了量子世界的怪异和违反直觉的本质.在这个思想实验中,一个人将一个硬币翻转并放在手背上.然后,这个人用另一只手盖住硬币,防止任何人看到硬币是正面还是反面.在经典世界中,掷硬币的结果是完全随机的,无法知道硬币的状态,除非这个人通过移开手来揭示结果.然而,在量子世界中,情况不同.
在量子力学中,粒子可以以状态的叠加形式存在,这意味着它们可以同时处于多个状态.薛定谔的猫著名例子最能说明这一点,在观察到猫之前,它同时是活的和死的.在量子硬币翻转的情况下,硬币可以同时处于正面和反面的叠加状态,直到被观察到为止.
那么如何确定量子硬币翻转的结果呢? 根据量子力学,必须“坍缩”叠加,迫使硬币处于正面或反面状态.这可以通过某种方式测量硬币来实现.然而,测量这个硬币的状态也会给系统带来不确定性.测量的行为导致叠加态塌陷成一个单一的状态,但是无法事先预测它将塌陷成哪个状态.
现在考虑一个博弈: 有2 个玩家,爱丽丝和鲍勃,玩量子硬币翻转.爱丽丝翻转硬币,把它放在手上,用另一只手盖住.然后鲍勃必须猜测硬币到底是正面还是反面.如果他猜对了,就赢了比赛.然而,如果他猜错了,就会输掉比赛.
在经典的掷硬币博弈中,结果是完全随机的,有50%的胜算或败算.然而,在一场掷硬币的量子博弈中,结果是由测量行为决定的.如果鲍勃以正确的方式猜测这个硬币的正反,他可以迫使叠加崩溃到他想要的状态,让他有大的机会赢得比赛.这听起来像是欺骗,但实际上这是量子世界中的合法策略.事实上,它是许多量子通信和密码学协议的基础.通过利用量子力学奇怪的性质,可以创建牢不可破的代码和安全的通信通道.
然而,重要的是要注意,量子力学的规则也限制了可以从量子系统中提取多少信息,这被称为不确定性原理.该原理指出,越精确地知道粒子的位置,就越无法精确地知道其动量,反之亦然.在量子硬币翻转的情况下,如果鲍勃非常精确地测量硬币的位置,他将给硬币的动量带来很多不确定性.这种不确定性将使鲍勃很难预测未来测量的结果,也就是硬币的状态,从而使他更难反复赢得比赛.
在其他研究方面,Eisert 等[6]采用量子方法量化了“囚徒博弈”,解决了经典模型无法解决的困境.Benjamin 和Hayden[7–9]、Lai 等[10–12]研究了多人的量子博弈,并证明了这种博弈中可能存在相干平衡策略.Marinatto 和Weber[13]研究的“性别之战博弈”,给出了博弈量化模型的独特平衡.文献[14]在量子计算机上实现了量子博弈的实验实现.1999 年,Meyer[15]通过研究“量子硬币翻转博弈”,给出了量子博弈和量子算法之间的关系,并指出量子算法总是能比经典算法更具优势.后来,Enk[16]宣布了问题的不同观点,Meyer[17]给出了回复.文献[15]研究了Q 如何击败P,其中Q 可以使用量子策略,而P 在“掷硬币博弈”问题中只能使用经典策略.
另一方面,文献[18]研究了经典统计力学到量子力学的推广,提出了N粒子一般W 态和概率隐形传态[19],文献[20]提出了多光子偏振纠缠簇态的产生和相应的开放目的地隐形传态,这些研究都满足不失不得的定量因果关系[21–24].量子非局域性使得量子力学具有许多独特和有用的特性,可用于量子隐形传态和量子密码通信等[25].
因此,本文旨在深入研究量子博弈中的“PQ”问题,探讨其描述、解决方法和实际应用.通过揭示量子博弈中的量子效应和策略选择,希望为量子计算领域的发展和博弈理论的拓展作出贡献,并为未来量子博弈研究的发展方向提供参考.
本文给出一般性的定义和描述,可以更好地理解相关概念.
经典博弈与量子博弈的对比: 经典博弈理论是研究参与者之间的冲突和合作关系的数学模型.在经典博弈中,参与者的决策是基于经典概率和策略进行的.然而,随着量子计算的兴起,量子博弈理论被提出来考虑在复杂系统中量子效应对参与者行为的影响.相对于经典博弈,量子博弈引入了量子策略和量子测量,使得参与者能够采取量子态来进行决策.
量子比特翻转博弈的定义与描述为: 量子比特翻转博弈是量子博弈中的一种典型模型.在这个博弈中,参与者面对一个由量子比特组成的系统,并通过施加操作来改变该比特的状态.博弈的目标是使得量子比特从初始状态翻转到目标状态.每个参与者可以施加一系列量子操作符来尝试达到目标状态,但这些操作符的选择和顺序会影响博弈的结果.参与者的收益取决于达到目标状态所需的操作次数.
零和博弈: 零和博弈是一种博弈模型,参与者之间的利益完全相反,一个参与者的收益的增加必然导致其他参与者的收益减少.在零和博弈中,参与者的收益之和为零,因此称为“零和”博弈.
公平博弈: 公平博弈是指在博弈中,参与者享有相同的信息和机会,不存在不公平的情况.在公平博弈中,参与者的策略选择和决策过程是公正的,没有偏向或优势.
非公平博弈: 非公平博弈是指博弈中存在不公平的情况,即参与者之间的信息和机会不均等.非公平博弈可能导致某些参与者在决策过程中拥有优势,或者在收益分配上存在不平等的情况.
“量子硬币翻转博弈”的过程是: P 将一枚硬币放入一个盒子中,并使正面朝上(即,人头浮雕所在面),依次轮流偷偷翻转(或不翻转)硬币,先令Q 进行操作,然后P 进行操作,然后Q 进行操作,在整个过程中,不允许打开盒子查看硬币的状态.完成操作后,人们打开箱子,如果正面朝上,定义Q 获胜,否则P 获胜.
然后可以定义基本向量{h,t}的二维向量空间V,其中h表示经过t次操作后硬币的状态.并将P 的经典策略标记为(即对硬币进行翻转),(即不对硬币进行翻转);Q 的策略是,其中ϕ,φ∈C,为ϕ和φ复共轭,ϕ和φ满 足即Q 采用量子策略,P 采用概率为p的经典策略.
因此,不论P 进行反转操作还是不反转操作,这两种策略对于Q 都为均衡策略.所以,策略集就是博弈的均衡解.
所以,得到定理:
经典和量子博弈中的均衡策略和均衡解定理: 不论经典策略的P 进行反转操作还是不反转操作,经典策略P 和量子策略Q 这2 种策略对于Q 都为均衡策略.并且策略集就是博弈的均衡解.
下面,给出量子硬币翻转博弈的一般性概括和一般性研究.
首先定义参与者和策略空间: 在“PQ”问题中,考虑有多个参与者的情况,每个参与者可以选择不同的量子策略来进行决策.参与者的策略空间包括参与者的量子操作符选择和操作的顺序.
收益矩阵和量子操作符的建模: 为了对“PQ”问题进行建模,使用收益矩阵来描述参与者的收益情况.收益矩阵将参与者的不同策略选择与对应的收益进行关联.同时,使用量子操作符来表示参与者在决策过程中的量子操作,这些操作可以改变系统的量子态.
“PQ”问题的分析框架: 针对“PQ”问题,需要建立一个分析框架来研究参与者之间的决策和收益关系.这个框架将考虑参与者的策略选择、量子效应以及收益分配等因素,以便解决“PQ”问题并分析其结果.
通过对量子比特翻转博弈、零和博弈、公平博弈和非公平博弈等概念的定义和描述,本文能够更准确地探讨量子博弈中的“PQ”问题,并为后续的分析和研究提供基础.
收益函数的定义: 在研究“PQ”问题中,需要定义参与者的收益函数.收益函数描述了参与者在不同策略选择下所获得的收益或效用.具体而言,可以考虑量子比特翻转博弈中的收益函数,其可以是基于博弈完成所需的操作次数、量子比特的最终状态或其他相关因素的函数.
数值模拟的设计与实现: 为了验证解决“PQ”问题的方法和算法的有效性,可以进行数值模拟实验.在模拟中,可以选择具体的参与者策略、量子操作符和收益函数,并进行大量的实验运行来获取统计结果.通过对不同参数和情景的变化进行实验分析,可以评估解决方案的性能和适用性.
本文从看似公平的量子硬币翻转博弈开始讨论,研究其是否公平.
由于首先将正面朝上放入盒子,然后依次将Q,P,Q 翻转(或不要翻转)硬币[15].显然,整个博弈是不公平的,因为Q 比P 做了更多的操作,这是Q 击败P 的原因.因此,应该增加一次将硬币掷给P 的机会,以保证博弈在真正意义上的公平.
现在给出“不完全公平博弈”和“完全公平博弈“的定义.
不完全公平博弈: 在2 个玩家的博弈中,当每个玩家的获胜概率相同,即他们的操作机会不同,即o1≠o2,o1,o2∈N,(on是玩家的操作时间,N 为自然数集),则该博弈被定义为不完全公平博弈.
完全公平博弈: 在2 个玩家的博弈中,不仅当每个玩家的获胜概率相同,即而且他们的操作机会是相同的,即o1=o2,博弈被定义为完全公平博弈.
在这场完整的公平博弈中,将讨论量子策略和经典策略,并研究哪种策略更有优势.
当p=1 时,ρ4变化为即硬币的反面向上,P 的回报为1,因此P 可以通过改变概率p来提高回报.
从上述结论可以发现,在这种情况下,Q 的量子策略并不优越,故当Q 和P 翻转硬币的时间相同时,博弈是“完全公平的博弈”.因此,发现Meyer[15]提出的“量子硬币翻转博弈”问题是一个“不完全公平的博弈”,整个过程需要重新讨论.
本文讨论的是量子策略和经典策略在博弈中谁是有利的,故2 个参与者都采用量子策略或经典策略的情况不需要讨论.
由于2 个玩家都不希望在第1 个循环中处于不利位置,因此,2 个玩家采用均衡策略集 ({F/2+故 在第1 个周期之后,硬币的状态为
因为硬币的纯量子态是线性叠加态,ϕ|h〉+φ|t〉(ϕ,φ∈C ,ϕϕ¯+φφ¯=1 ),因此任何状态ρ都可以描述为
当ρ4的所有对角元素仍然是1/2(即正面的向上和向下概率都是1/2)时,P 的策略仍然可以确保其预期收益为0,而不考虑Q 所采用的策略.同样,Q 也可以保证或者0,使得ρ4的所有对角元素仍然是1/2 以确保其预期收益为0,无论P 采用何种策略.因此,策略集{F/2+N/2,Ω(ϕ1,φ1),F/2+N/2,Ω(ϕ2,φ2)}是均衡的,其量子策略收益与经典策略相同.
另外2 个元素是交叉项,由量子策略的影响产生.因此,交叉项只影响量子策略行动后的状态,对这种状态的回报没有任何影响,现在可以使用多轮量子硬币翻转博弈来解释,得到
(8)式的对角元素为
很明显,这种状态受到交叉项的影响.但当玩家采用经典策略ρn-1时,交叉项不会产生任何影响.在此,仍然利用方程(7)中首次出现的公式来获得
从(7)式—(11)式发现交叉项对一个循环中的最终状态没有任何影响.
那么当交换一下P 和Q 的操作顺序,会出现什么情况? 依旧选择让P 采用量子策略,Q 采用经典策略.首先,Q 采用经典策略,用概率翻转硬币后,状态变为然后P 通过量子策略操作,然后状态变为
在这之后,Q 再次采用经典策略,很可能会把硬币翻过来
因此,关于 $Q和 $P的不同具体表达,得到了一个有趣的一般关系
等式 (15)意味着等式 (15)的某些量的某些变化一定会导致等式 (15)中的其他量的相对一些变化,从而使等式 (15)的右侧保持不失不得,即零,即等式 (5)也满足定量统计定量因果关系.
所以,得到定理:
经典和量子博弈中的量子预期收益和经典预期收益的零和定理,对于量子Q 的预期收益 $Q和经典P 的预期收益 $P的不同具体表达式,存在一般零和关系 $Q+ $P=0 .
这是因为许多一般的物理过程都应满足定量因果关系,且具有不失不得的特征[21–24],而上述研究满足定量统计定量因果关系,因此上述研究是自洽的.特别地,等式 (15)只是2 个玩家公平博弈的所有收益的零和性质.
渐进与非渐进结论的确定: 本文需要明确论述结论公式的性质是渐进的还是非渐进的.这取决于具体研究的问题和解决方案.如果能够证明随着问题规模的增加,解决方案的性质会趋于稳定或收敛到一个特定值,那么可以得出渐进结论.然而,如果结论公式的性质随着问题规模变化而变化,那么将得到非渐进的结论.故结论(15)式是渐进的.
最优策略的确定: 为了确定最优策略,可以运用优化算法和方法来寻找在给定情况下能够最大化参与者收益的策略.这可以涉及到数值优化技术、动态规划和遗传算法等.通过对问题的建模和算法设计,可以找到最优策略的一般形式或具体的策略选择.通过以上分析和实验,能够得出关于“PQ”问题的结论,包括最优策略的性质、收益函数的影响以及解决方案的效果评估.这些结论的形式取决于具体的研究内容和问题的特点.
因此,当2 个参与者掷硬币的操作机会相同(即“完全公平的博弈”)时,无论参与者采用何种策略,都不能单方面提高自己的收益.
当参与者掷硬币的次数不同时(即“不完全公平的博弈”),定义掷硬币次数为2n+1 次的奇数参与者和掷硬币次数2n次的偶数参与者.量子策略是奇数参与者的最佳选择,其可以确保奇数参与者的收益大于偶数参与者的收益,即在不完全公平博弈的情况下,奇数参与者所采取的策略决定了2 个参与者的预期收益.
从均衡的角度出发,可以将纳什均衡进一步细分为2 种: 一种是对称纳什均衡,即通过采用纳什均衡策略,所有参与者在博弈后的收益是相同的;另一种是非对称纳什均衡,即通过采用纳什均衡策略,所有参与者在博弈后的收益不尽相同.
这种方式使比赛成为完全公平的比赛,并保证比赛的公平属性.在这种情况下,其他类似的比赛都采用了类似的规则,这确保了比赛是在完全公平的情况下的比赛.
本文对“PQ”问题进行了全面的研究与分析,并提出了解决方案和应用前景.量子博弈理论为科研人员理解复杂系统中参与者行为的量子特性提供了新的视角.随着量子计算技术的进一步发展,相信量子博弈研究将在未来发挥更重要的作用,并对各个领域产生深远的影响.
总之,量子硬币翻转是一个迷人的思想实验,其说明了量子世界的奇怪和违反直觉的本质.通过利用量子力学的性质,可以创造出新的强大技术,但也必须意识到不确定性原理带来的局限性.在量子硬币翻转博弈中,如果鲍勃正确测量硬币,量子力学的规则会给他更大的获胜机会,但这种操作也有其自身的局限性和挑战.
本文给出了“不完全公平博弈”和“完全公平博弈“的定义,从而对文献[15]进行了修改,使博弈公平.在此条件下,讨论并研究了“量子硬币翻转博弈”,将硬币翻转的次数扩展到任意数,通过交换量子策略和经典策略,再次给出了“量子硬币翻转博弈”的量化过程,得到了2 个参与者公平博弈的所有收益的零和性质的表达式.
最后,得出了量子策略在完全公平博弈条件下是不完全有利的,而量子策略只有在不完全公平博弈的条件下才有利,这些更本质的结论—完全公平和不完全公平是相对于整个博弈而言的,并通过一些例子来表达和解释其在现实中的意义.本文推导的这些结果在世界上广泛领域的不同类型双人比赛中具有非常重要的理论意义和非常有用的实用价值.