打开交易数据背后的“黑匣子”
——以伦锌为例的实证分析

2019-03-07 08:27潘敬胥少阳
中国有色金属 2019年5期
关键词:持仓量胜率黑匣子

潘敬 胥少阳|文

对期货价格进行技术分析,量(成交量、持仓量)、价(价格及其形态)因素缺一不可。采用无监督学习的方法对伦敦金属交易所锌三月期货合约进行大数据挖掘,让数据说话,打开背后的“黑匣子”、揭示量与价之间的量化关系。

在传统的技术分析方法中,学者们对量、价因素有着大量的定性研究:例如,具有长上(下)影线的蜡烛图往往预示着趋势的反转。价格下跌,而成交量、持仓量增加,预示着价格仍将下行。然而多长的上(下)影线才会预示着趋势反转? 成交量、持仓量的变化需要达到什么样幅度才会对价格趋势产生影响?如果基于价格形态上看涨,但从量的因素分析上看跌,投资者们该如何综合分析?诸如此类问题,仅仅依靠定性分析是无法解答的。投资者们不得不加入更多的主观判断。随着科技的日益发达,投资者们获得交易数据的途径更加便捷,通过对这些数据进行挖掘,找出潜在的量化信息,弥补了传统技术分析方法上的不足。因此,近年来,通过大数据学习制定交易策略的方法越来越受到青睐。本文采用无监督学习的方法对伦敦金属交易所的锌三月期货合约(以下简称“伦锌”)进行分析,挖掘背后蕴藏的定量关系并将具有相似量价关系的交易日归为一类,通过对交易日进行分类,找出最优的交易策略。

数据与模型

本文采用伦锌合约过去2527 个交易日的数据(2009年1月9日~2019年1月12日),包括:最高价、最低价、开盘价、收盘价、成交量以及持仓量,在R 语言平台进行挖掘。

首先,确定数据挖掘的维度。基于以上数据,模型从5 个维度进行分析:第一,最高价与收盘价的差;第二,最低价与收盘价的差;第三,最高价与最低价的差;第四,当日与上一交易日持仓量的变化;第五,当日成交量。第一个及第二个维度反映了价格冲高回落或触底反弹的程度,第三个维度为当日最大的波幅,持仓量的变化反映了当前价格是由于交易者清仓离场还是主动开仓造成的,成交量维度反映了价格变化的能量。在对数据进行挖掘之前,首先对以上五个维度的数据进行标准化处理。

第二,选择数据挖掘的算法。本文采用层次聚类(Hierarchical Clustering)中的最远距离聚类算法(Farthest-Neighbor Method) 从 以 上5 个 维度对2527 个交易日进行分类,将具有相似交易情况的交易日归在一起。最远距离聚类算法通过计算欧氏距离来确定每个交易日之间的相似程度:

模型输出结果

在确定45 个类别个数后,最远距离聚类算法将2527 个交易日分别归入到45 个类别之中,其中第7 个类别包含的交易日最多,共413 个交易日,第20、21 和第43 个类别包含的交易日最少,分别只包含了一个交易日。以第19 个类别为例,有6 个交易日被归到了一起,从下图的数据可以看出(图1),虽然每个交易日所处的价格区间大有不同,但这6 个交易日的波幅普遍较大,蜡烛图实体较长,成交量也相对较大。

2018年11月12日 与2018年11月13日伦锌价格分别收于2498 美元/吨、2492 美元/吨,虽然连续2 个交易日的收盘价基本持平,波幅也较为相似,但2 个交易日分别被无监督学习模型纳入了第7、第10 个类别,或许这是由于2 个交易日的冲高回落幅度相差较大的所造成的,2018年11月12日从最高价到收盘价回落约0.99%,而11月13日的回落幅度约1.96%(图2)。由此可见,数据挖掘可以帮助人们找到大数据背后更多的潜在信息。

图1 第19个类别所包含的交易日

图2 2018年11月12日与2018年11月13日的分类结果

图3 10种最优做多交易策略

图4 10种最优做空交易策略

交易策略

一个好的交易策略需要满足三个条件:第一,胜率高;然而胜率高并不能保证最终盈利。假设根据一个策略共交易10 次,其中9 次正确,每次盈利1美元,而最后一次交易亏损100 美元,最终亏损为91 美元,所以第二个条件是较高的盈利;第三,最大回撤较低。通过聚类分析,2527 个交易日被分为45 个类别,也就意味着总共有1980 种(45×44)开平仓类别组合。我们选定过去2527 个交易日中胜率高于70%的开平仓组合,并按照最大回撤进行排序,分别选出10 种最优的做多、做空策略。

图3为最优的10 种做多策略。10种开平仓组合在过去10年中总计出现过57 次,利润率均达到了两位数,但是其中7 种策略的最大回撤幅度较大,超过了10%。

最优的10 种做空策略在过去10年间共出现过60 次(图4),胜率高的同时,利润率也超过了10%。其中排在第一的做空组合的最大回撤仅为7%左右,利润率却高达18%。

将未来的交易日归类

得出最优策略后,下一步需要将未来的每个交易日归入到45 个类别之中。首先,可以选择神经网络或逻辑回归等算法对过去的2527 个交易日及其所属类别标签进行有监督学习,挖掘出背后的分类算法,其次,将新的交易日的5 个维度代入到算法中,从而得出其所属类别。由于篇幅原因,本文在此不做详细描述。

结论及未来研究方向

对交易数据进行深度挖掘可以帮助人们找到背后的量价关系,做出科学的投资决策,从而避免了主观判断上的随意性。对于伦锌来说,根据过去10年间的数据,本文分别选取出了10 种最佳的做多和做空交易策略。所选取的交易策略胜率较高且利润率超过10%以上,但由于锌的交易流动性较好,波动较大,最大回撤幅度也比较高。

对于模型本身而言,在未来可以向两个方向继续进行扩展:一是可以根据不同的交易频率(15 分钟、30 分钟、1小时级别等)从新对数据进行学习;二是可以增加更多的分析维度,例如通过增加时间维度,来反映一个趋势力度的变化。

猜你喜欢
持仓量胜率黑匣子
黑匣子究竟是什么
东航失事客机第二部黑匣子抵京
主客场因素对大学生篮球联赛战绩的影响研究
快递黑匣子
2014—2015年中国女子篮球职业联赛单节得失分与比赛结果相关性分析
解密“黑匣子”
上涨讯号跟进
继续看涨
期指进入多头模式
持仓量继续下降