万梅杰
金融交易数据的图形化技术分析研究
万梅杰
(深恒和投资管理(深圳)有限公司,广东 深圳 518042)
通过对金融交易数据进行采集和处理,计算各板块的相对成交量,应用Surfer 11软件对数据进行图形化,生成各板块的相对成交量的二维等值线图、二维剖面图、三维地形图等图形.通过对图形的分析研究,判断各板块的成交活跃度,为金融交易提供参考.对金融数据进行图形化分析,可以为相关技术人员提供借鉴.
金融数据;数据处理;数据挖掘;三维图形;图形化
金融交易是当代社会活动中最具挑战性的一类活动,而其中股票证券、外汇、债券、黄金和原油、各类期货、期权等交易最为人们所熟悉.全球金融交易市场每天产生大量数据,如何从这些海量的数据中发掘其中隐藏的信息与知识,从而指导我们的金融交易,一直是金融行业分析和交易人员以及决策者们的努力目标.传统方式是通过对交易数据和简单图形的阅读或检索,以及辅以一些统计方法来提取知识或藉此建模.近十几年来,随着计算机技术的发展,融合数据库、统计、人工智能等技术的数据挖掘技术来分析金融交易数据的方法,得到了很大的发展.相关机构利用各种计算机软件对金融数据进行统计和分析[1-5].
金融交易数据有三大因子,价格、时间、成交量(成交额).本文借助计算机图形技术,利用Software公司的三维图形生成软件Golden Surfer 11.0,尝试将金融交易数据三大因子中的成交量作为研究对象,把离散的金融数据表示为二维及三维图形,从而给金融交易数据挖掘开辟一个新的思路,希望能为金融交易人员的金融分析与交易系统的形成提供可视化的金融数据模型.
通过对金融交易的成交量因子进行数据采集、数据预处理、数据再加工,绘制图形(二维或三维)4个步骤,将交易数据表图形化,把金融交易成交量数据模拟成山峰、山谷、丘陵、平原等,构成三维地形地貌,通过地形地貌高低起伏直观显示成交量在横向比对与纵向发展的变化,发掘有用的知识与信息,为金融交易的决策提供服务.技术框图如图1所示.
图1 技术方案框图
本文中的数据来自上海证券交易所A股在一定时间段的交易数据.上证指数在2015年6月12日这一周达到阶段性高位5178点后,随后上证指数开始长时间的调整.为了使图形化处理结果更有意义,成交量的数据选取的时间段为2015年6月12日至2019年9月30日.通过对2015-2019年长达四年多的成交量分析,可以对上证交易市场自5178点这个阶段性高点以来的大调整过程有一个全貌性的认识.数据采集的周期窗口为一周,即大致按5个交易日的上证A股(综合)周成交量(特殊节假日的周成交量对应的天数略有减少)提取成一个数据,同时还采集了各板块的周成交量,例如:工业板块B2、商业板块C3、房地产板块D4、公用板块E5、能源板块F6、材料板块G7、消费板块H8、医药板块I9、金融板块J10、信息板块K11等,数据见表1.
表1 上证A股和各板块的每周成交量(106股)
数据采集后,为了便于后续的图形化处理和比较各板块的成交趋势,定义一个参数为相对周成交量,并建立坐标系统.
因为各子板块股票构成数目不同,活跃度不同,成交量区间较大,为了便于比较分析,计算相对周成交量:
相对周成交量为各子板块的第周成交量(具体为B2()、C3()、D4()、E5()、F6()、G7()、H8()、I9()、J9()、K9()等)与上证综指对应的周成交量A1()的百分比,各板块的相对周成交量,即为B2()/A1()、C3()/A1()、D4()/A1()、E5()/A1()、F6()/A1()、G7()/A1()、H8()/A1()、I9()/A1()、J10()/A1()、K11()/A1().为描述方便,简称相对成交量.各板块的相对成交量见表2.
为图形化需要,建立直角坐标系,坐标定义如下.
横坐标表示周数,以2015年6月12日(上证指数为5178点)所在的周为起始周,以2019年9月30日为统计终止周.周数区间为1到215.
纵坐标表示子版块代号,子版块代号人为设定,如工业板块坐标设为2,商业板块坐标为3,房地产坐标为4,公用板块坐标为5,能源坐标为6,材料板块坐标为7,消费板块坐标为8,医药板块为9,金融板块为10,信息板块为11等.
坐标,表示各子板块的相对成交量.
以医药板块I9和房地产板块D4为例,定义坐标,相对成交量见表3、表4.
表2 各板块的相对成交量(%)
表3 医药板块I9的相对成交量(%)
表4 房地产板块D4的相对成交量(%)
以上处理可在电子表格软件中完成,可选择CSV格式,或TXT格式或DBF等格式保存,提供给Golden Surfer 11.0调用.
需要说明的是:上述数据在最终实际成图时,为了突出所关注的板块相对成交量,需要进行微调.通过调整数据中纵坐标排列顺序,将相对成交量大和相对成交量小的板块或错开、或集中,生成不同版本的图形.
1)打开美国GOLDEN公司的surfer 11版本软件,在菜单网格(GRID)的数据菜单项,调入CSV格式的上证各板块成交量带坐标的数据,设定合理的间距,以及选定合适的网络化的方法,对于跳跃性不大的数据一般选用“与距离成反比的网络化方法”,随后软件生成专用的网格文件.
2)在图形(Graph)菜单下的“新建菜单”,可先进行二维信息的挖掘,选择“等值线图”选项,调入上一步生成的上证板块成交量之网格文件,确定后即生成板块相对成交量二维等值线图,如图2所示.
图2 上证各板块成交量等值线图
相对成交量二维等值线图表达了各板块在二维时空坐标下的分布图,高值(深色表示)对应的图形分布区表示相应板块在该期间成交较活跃,间接说明此期间的该板块的获利可能性较大,适合短期投资交易;低值(浅色表示)对应的图形分布区表示该板块成交稀少,也间接说明期间的获利空间小,不适于大资金交易,也不宜短期的投资交易.
与相对成交量的二维图形相比,相对成交量的三维图形可以更直观的体现各板块的活跃度.三维图形的获取方法和二维图形获取类似,在图形菜单下的“新建菜单”,选择“3D曲面图”选项,调入前面生成的上证板块成交量之网格文件,生成上证板块三维成交量图,如图3所示.
图3 各板块相对成交量三维地形图2
在三维地形图中,某个板块在某段周期的成交量在三维地形图中形成“高山”,就表示同期成交量占比最大,最活跃,如果该板块持续构成高地,表示此板块持续获得市场主力的青睐,其他投资者参与其中获利可能性增大,某个板块在某段周期的成交量在三维图形中形成相对的在低洼的“山谷”,或类似于“丘陵地带”则表示同期内相对其他板块而言,该板块不活跃,因此投资者参与其中的获利机会相对也少.
在三维地形图中,选取了第33周表现出高谷的医药板块,和第31周表现出高谷的房地产板块,可以见到医药板块中如康龙化成(图4)、房地产板块如碧桂园(图5)等股价均呈现上行趋势,与三维图表现相吻合,证明了其具有一定可靠性.
图4 第33周医药板块康龙化成股票表现
图5 第31周房地产板块碧桂园股价表现
本文通过采集上证综指阶段性高位(5178点)后4年多各板块的交易数据,计算了各板块相对成交量.建立适当的坐标系,通过调整数据中纵坐标排列顺序,将相对成交量大和相对成交量小的板块或错开、或集中等,对交易数据进行处理,将成交量数据存入CSV文件.利用surfer软件,调入成交量数据文件,生成二维等值线图、二维剖面图和三维地形图等.根据图形特征判断各板块的交易活跃度,各种图中数值的高低表达了相应板块交易活跃度的高低,从而为投资者进行投资交易提供指导.本文对金融数据的图形化分析方法,可以为相关技术人员提供借鉴.
[1] 胡珉,孙瑜峰.基于状态演化的股市变化趋势可视化预测方法[J].计算机辅助设计与图形学学报,2014,26(2):302-313.
[2] 李绍荣.SURFER软件图形数据的进一步处理和利用[J].探化探计算技术,1997(2):174-180.
[3] 刘丽峰.一种基于清洗关联规则的金融数据挖掘算法[J].微电子学与计算机,2012(5):174-177.
[4] 李永福,张冬梅,周成伟.用Surfer软件对图形间接数字化方法[J].微计算机应用,2004,19(5):635-635.
[5] 易东云,张维明.金融数据挖掘中的非线性相关跟踪技术[J].软件学报,2000,11(12):1581-1586.
Analysis and Research on Graphic Technology of Financial Transaction Data
WAN Meijie
()
Through the collection and processing of financial transaction data, the relative trading volumes of various stock sectors are calculated, the two-dimensional isogram, sectional drawing, three-dimensional topographic and other graphics of the relative trading volume of each stock sector are generated with “surfer 11”software. Then, through the analysis and research of the graphs, the transaction activity of each stock sector is judged, and reference for financial transactions is provided. In this paper, the method of graphical analysis of financial data can provide reference for the relevant technical personnel.
financial data; processing data; data mining; 3D graphics; graphics
TP3-05
A
1672-0318(2022)03-0050-05
10.13899/j.cnki.szptxb.2022.03.008
2021-10-10
万梅杰,男,湖北随州人,硕士,深恒和投资管理(深圳)有限公司研究员,研究方向:金融、财务管理.
(责任编辑:王璐)