算法策略在连续双向拍卖市场的研究

2019-12-09 01:57曹阳
财讯 2019年27期
关键词:人机交互算法

摘  要:伴随着互联网技术的应用,连续双向拍卖机制在商业世界广泛运用,引发诸多学者对该机制的研究与探索。本文详细介绍了连续双向拍卖机制的研究方法、在连续双向拍卖机制下的算法策略以及人工交互实验方法,分析了竞价策略研究的发展前景。

关键词:连续双向拍卖;算法;人机交互

拍卖机制是指根据一系列规则竞价决定的价格来决定资源配置的市场机制。经典的拍卖机制多为单向拍卖。近年来随着互联网的发展,双向拍卖制度引起了学术界的广泛关注。相较于“1对多”的单向拍卖而言,双向拍卖为“多对多”形式,竞价双方均存在多位参与者,买卖双方是平等的供给与需求关系。传统双向拍卖分为连续双向拍卖与集和竞价。连续双向拍卖市场中,买卖双方根据市场规则提交报价,一旦市场中出现可成交价格,便立即达成交易,若未达成交易,买卖双方可调整报价;集和竞价市场中,买卖双方在开放期内根据市场规则自由竞价,开放期结束后,使得市场成交数量达到最大的报价成为市场价。两种机制各有利弊,互为补充,在现实经济中经常联合使用,如股票市场,便采用集和竞价启动市场,连续双方拍卖运行市场。由于连续双向拍卖机制的动态性和随机性,连续双向拍卖市场的竞价策略相较于单向拍卖、集和竞价更为复杂,受到学术界更加广泛的关注。

一、连续双向拍卖市场最优策略的研究方法

(1)纳什均衡求解

Chatterjee和Samuelson将博弈论方法运用于双向拍卖市场中的均衡竞价策略研究中,得到了只包含一个买方、一个卖方和一件商品的简化双向拍卖市场中的贝叶斯纳什均衡策略。Satterthwaite和Williams等人扩展到多个买卖双方的情形,并证明随着买卖双方参与者人数的不断增加,市场效率逐步提升,双方报价更加趋近真实报价。Friedman提出双向拍卖市场的价格形成模型,将双向拍卖简化成贝叶斯更新过程,证明了买卖双方存在最优简单策略。

(2)实验经济学方法

实验经济学在连续双向拍卖市场中的竞价策略研究分为两种:一是计算机仿真实验,利用计算机对所设计策略进行模拟实验,通过不同策略的实验结果对比,分析策略优劣。二是人机交互实验,用算法机器人替代部分人类参与者,观察人类交易者与算法交易者身处同一市场的交易结果。伴随人工智能的发展,人机交互实验为连续双向拍卖的竞价策略研究提供了更为契合真实世界的研究方法。

二、经典算法策略简介

(1)连续双向拍卖机制设计

大多数连续双向拍卖市场的研究围绕Smith的市场协议开展:假定市场中只存在一类同质商品,交易期内,买卖双方可对商品进行报价,但每次报价只能指定唯一商品。只要市场上的卖方报价与买方报价相互匹配,立即达成交易,交易价格为达成交易的买卖方报价的平均值,交易期间允许双方修改报价,市场存在多个交易日,每个交易日有多个交易期,每个交易期期初更新商品保留价格。市场出清或实验预定时间达到即交易结束。同时,Smith开创性的设计了诱导序列以控制实验环境:在交易期开始阶段,分配给买家和卖家一个保留价格序列。买家序列为逐渐降低的价值序列以控制市场的需求曲线;卖家序列为逐渐上升的成本序列以控制卖家的供给曲线。在此假定买方价值为w,卖方成本为c,成交价格为p。那么对应的买方剩余为w-p,卖方剩余为p-c。基于Smith的研究,定义市场分配效率为所有的买方剩余与卖方剩余之和和理论剩余值的比值。

(2)零智能算法

Gode和Sunder提出了两种零智能算法,分别为ZIU算法和ZIC算法。假设市场允许的最高报价为x,最高报价为z,Vi为第i个算法买方交易员保留价值,Cj为第j个算法卖方交易员保留成本。ZIU算法中买卖双方策略均为[x,z]的均匀分布随机值。ZIC算法:买方策略为[x,Vi]的均匀分布随机值;卖方策略为[Cj,z]的均匀分布随机值。实验结果表明:即使是零智能算法策略机器人参与连续双向拍卖,也能达到资源配置的有效性。证明了连续双向拍卖机制的有效性依赖其市场规则,与交易者的动机、市场信息和自我学习无关。

(3)增强零智能算法

Cliff和Bruten发现在非对称市场结构下ZI算法并不能达到高市场效率,并提出增强零智能算法(ZIP算法)。ZIP算法引入自我学习机制,根据市场信息进行简单的自学习。ZIP算法根据四类市场信息调整利润率进而修改自身报价:自己的上期报价p是否成交;市场最新报价q;q是买方报价还是卖方报价;报价q是否达成交易。如果自身报价p在市场中达成交易,算法交易员不会降低自身利润;如果市场中有新的交易达成,那么报价高于等于成交价的买方交易员将提高利润率,报价低于等于成交价的卖方交易员将提高利润率;当市场中出现新的买方报价,报价低于最新报价的买方交易员降低利润率;当市场中出现新的卖方报价,报价高于最新报价的卖方交易员降低利润率。利用以上拥有简单自学习能力的ZIP算法交易员进行仿真实验发现,在更一般的市场供需结构下,ZIP算法相较ZI算法更接近人类在连续双向拍卖机制下的市场表现。

(4)GD算法

GD算法是Gjerstad和Dickhaut基于啟发式信念学习模型的一种算法,该算法主要包括以下三个核心元素:启发式信念函数,通过收集市场数据,将过去n期市场所有交易者的出价信息和成交情况整合为历史数据集,利用数据集求解价格p达成交易的概率;基于信念的期望剩余价值最大化,根据启发式信念函数,计算以价格p出价的期望剩余价值,根据最大化结果决定出价;决定提交报价的时间。该算法的特点是接近于理性人的决策思维。

(5)AA算法

Vytelingum提出了自主交易代理策略(AA策略),该策略基于长期和短期学习,使得算法可以调整自己的出价,并在各个环境下保持高效。短期学习将根据市场波动调整其“侵略度”,高侵略度意味着其追求更高的成交概率而会主动放弃一些收益。低侵略度则追求更高的收益而损失一些成交的概率。长期学习则基于每次交易后的市场信息调整决定侵略度影响出价的参数。短期学习的核心是对市场波动的即刻反应,长期学习的核心则是适应市场供需变化的长期趋势。分析AA算法与ZIP算法、GD算法的仿真实验结果可知:无论是静态还是动态实验环境,AA算法均表现更优。

[6]Gjerstad,S.,Dickhaut,J.Price Formation in Double Auctions[J]Games and Econimic Behavior,1998.22:1-29

[7]Vytelingum P,Cliff D,Jennings N R.Strategic bidding in continuous double auctions.Artificial Intelligence,2008.172(14):1700~1729

[8]Yue C,Mabu S,Hirasawa K.A bidding strategy using genetic network programming with adjusting parameters for large-scale continuous double auction.In:2012 IEEE International Conference on Systems,Man,and Cybern etics(SMC),New York: IEEE Press,2012:1896~1902.

[9]Zhan W,Zhang J,Yang J,etal.K-ZI: A general zero-intelligence model in continuous double auction.International Journal of Information Technology & Decision Marketing,2002.1(4):673~691

[10]詹文杰,楊洁.连续双向拍卖市场中基于马尔科夫链的交易策略研究。中国管理科学,2008.16(1):111~116

[11]詹文杰,白延涛.基于动态 Hurwicz 准则的连续双向拍卖报价策略研究.管理学报,2014.11(3):

[12]栾海军,董红斌,周阳.连续双向拍卖市场中的一种自适应竞价策略研究[J].南京大学学报,2015.51(2)

[13]RAJARSHI DAS,JAMES E HANSON,JEFFREY O KEPHART,et al.Agent-human interactions in the continuous double auction[C]//International Joint Conference on Artificial Intelligence.2001.17:1169–1178.

[14]MARCO DE LUCA,DAVE CLIFF.Human-agent auction interactions: Adaptive-aggressive agents do Minate[C]//Proceedings of the Twenty-Second international joint conference on Artificial Intelligence.2011.1:178–185.

[15]M DE LUCA,C SZOSTEK,J CARTLIDGE,et al.Studies on interactions between human traders and Algorithmic Trading Systems[J].UK Government Foresight Project,2011.

[16]JOHN CARTLIDGE,CHARLOTTE SZOSTEK,MARCO DE LUCA,et al.Too Fast Too Furious Faster Financial-market Trading Agents Can Give Less Efficient Markets[C]//ICAART,(2)2012:126–135.

[17]VERNON L SMITH.An experimental study of competitive market behavior[J].The Journal of Political Economy,1962.70(2):111–137.

[18]VERNON L SMITH.Experimental economics: Induced value theory[J].The American Economic Review,1976.66(2):274–279.

[19]M.He,H.F.Leung,N.R.Jennings,A fuzzy logic based bidding strategy for autonomous agents in continuous double auctions,IEEE Transactions on Knowledge and Data Engineering 15(6)(2003)1345–1363.

[20]J.Nicolaisen,V.Petrov,L.Tesfatsion,Market power and efficiency in a computational electricity market with discriminatory double-auction pricing,IEEE Transactions on Evolutionary Computation 5(5)(2001) 504–523.

[21]S.Phelps,S.Parsons,P.McBurney,An evolutionary game-theoretic comparision of two double auction market designs,in:Proc.Sixth Workshop on Agent Mediated Electronic Commerce,2004,pp.192–198

作者简介:曹阳,1995,男,汉,四川,硕士,武汉大学,实验经济学 4430072。

猜你喜欢
人机交互算法
国际主流轧差算法介绍:以CHIPS的BRA算法为例
Travellng thg World Full—time for Rree
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
某型柴油机虚拟维修系统研究
基于虚拟现实技术的九江城市交通事故模拟系统设计
人机交互课程创新实验
多点噪声远程自动采集系统设计
比比谁的算法妙