荀振宇 王卫涛
摘 要 本文设计了基于改进的近邻传播聚类算法的金融市场分析案例。首先,本文提出了基于属性权重以及核变换的WHAP算法。WHAP算法首先计算出样本集每维特征的权重值,然后根据每维权重值计算出样本点之间的距离,再然后通过核函数将样本点之间的距离进行映射变换计算出相似度矩阵,最终计算出解聚类结果;然后,本文结合Spring boot、Redis、Vue、MySQL搭建出一套应用开发系统,该系统进行数据的选择同时将数据量化为WHAP算法可处理的数据集,然后将此数据集作为该算法的输入样本集,再然后通过计算将聚类结果转换为页面可视化数据,最终通过聚类结果为金融市场提供有效的参考方案。
关键词 权重;核函数;Spring boot;金融市场
Financial Market Analysis Based on Kernel Transformation Affinity Propagation clustering algorithm
Xun Zhenyu1, Wang Weitao2
1. The First Military Representative Office of the Maritime Equipment Shenyang Bureau in Dalian, Dalian 116000
2. 713th Research Institute China Ship Building Industry Corporation, Zhengzhou 450000
Abstract This article designs a financial market analysis case based on improved Affinity Propagation clustering algorithm. First, this paper proposes an WHAP algorithm based on attribute weights and kernel transformation. The WHAP algorithm first calculates the weight value of each dimension of the sample set, then calculate the distance between the sample points according to the weight value of each dimension, Then use the kernel function to map the distance between the sample points to calculate the similarity matrix, Finally calculate the clustering results; Second, This article combines Spring Boot, Redis, Vue, and MySQL to build a set of application development systems, The system selects data and quantizes the data into a dataset that can be processed by the WAP algorithm, This data set is then used as the input sample set for the algorithm, The clustering results are then converted into page visualization data by calculation, Finally, provide effective reference solutions for financial markets through clustering results.
Key words Weights; Kernel function; Spring boot; Financial market
引言
2007年Frey和Dueck在Science上发表了Points Clustering by Passing Messages Between Data,系统阐述了近邻传播聚类算(Affinity Propagation, AP)的原理和应用。近邻传播算法不需要事先设定聚类的个数,不需要初始化聚类中心点,是一种快速有效的聚类算法[1]。但是在研究的过程中,发现近邻传播算法在处理现实生活中实际的应用问题上,略显不足。
本文针对上述提到的问题,提出了WHAP算法。目的是通过改进的近邻传播聚类算法来处理现实生活中的应用问题,同时选取股票数据集作为金融市场分析的量化指标,最终将该算法应用于股票数据集上[2]。通过实验结果表明改进后的近邻传播聚类算法具有一定的应用价值。
1 近邻传播聚类算法(AP)
近邻传播聚类算法根据样本点之间的相似度进行迭代计算。其中计算相似度矩阵的公式如下:
(1)
该算法引入了归属度矩阵A和吸引度矩阵R。其中:,。计算公式如下:
(2)
(3)
(4)
(5)
在计算归属度矩阵相似度矩阵过程中,引入了阻尼因子来增强算法的稳定性,计算公式如下:
(6)
(7)
其中聚類目标函数如下:
(8)
式中,为样本点i的聚类中心点,是由组成的向量。其中计算公式如下:
(9)
迭代结束之后通过计算的值来确定聚类中心点,当时,样本点即为聚类中心点。各个样本点的聚类中心点的计算公式如下:
(10)
2 WHAP算法
首先计算出样本点之间的相似度S,
,
其中,,
。式中,指数是核函数的调整因子,调整其映射空间的范围。其中,,均为系数,取值范围为。
在计算相似度矩阵S后,然后根据第一章节中介绍的计算步骤去计算出最终的聚类结果。
综上所述,WHAP算法步骤见表1:
3 应用开发相关技术介绍
3.1 Spring原理及介绍
Spring是一种轻量级的Java开发框架,能降低逻辑层与其他各层的耦合度,它的特点有[3-5]:①方便耦合;②支持AOP;③通过声明式方式管理事务;④方便测试;⑤对Java EE API进行封装,方便使用;⑥易于学习。
3.2 Redis原理及介绍
Redis是目前应用的最广泛的分布式缓存架构之一,是一种key-value型数据库,它可以减少磁盘的IO操作以及数据库的访问次数,从而可以提高系统的整体性能,尤其是在多用户访问的情况下,Redis表现得更加优异[6]。
3.3 Vue原理及介绍
Vue是视图层面的一种渐进式架构,Vue最主要的特点是它实现了响应式编程,当数据发生改变时,视图会自动更新,通过利用Object.defineProperty 转换为 getter/setter,实现数据变化监听功能[7-9]。
3.4 MySQL原理及介绍
MySQL是一种轻量型数据库管理系统,开放的源码为设计师提供了大量的改进接口,同时它自身运行速度快、系统稳定、免费开放赢得了大量用户的信赖[10-12]。
4 股票数据
本文从盈利能力、成长能力、经营能力、现金流能力以及负债能力等多个角度来分析股票的价值,详细指标见表2:
上表的各个指标的计算公式见表3:
5 系统设计步骤
结合前几节对WHAP算法的分析以及对应用业务的详细介绍,现整个系统设计如下表所示:
6 实验结果
本文开发了一套集成了改进的近邻传播聚类算法和选择数据并反馈数据的系统,该系统根据盈利能力、成长能力、经营能力以及现金流能力多个角度来分析股票的价值。
该系统提供了选择股票的界面,用户可以通过自主选择股票,为用户提供了极大的便利。
从上图可知,从盈利能力、成长能力、经营能力以及现金流能力多个角度来选取投资价值更高的股票是具备一定的现实意义的[13]。WHAP在股票分析等金融市场领域具有一定的参考价值。
7 结束语
本文介绍了近邻传播的原理与步骤,同时介绍了通过指标权重以及核函数计算相似度的方法,然后介绍了基于Spring boot+Redis+Vue+MySQL架构的应用系统,该系统提供了选择数据以及反馈数据等功能。通过实验结果分析表明改进后的近邻传播聚类算法具备一定的应用价值。
参考文献
[1] G Hongyu. Research on term weighting algorithm based on information entropy theory[J]. Computer Engineering & Applications,2013,49(10):140-146.
[2] Gan G,Ng K P. Subspace clustering using affinity propagation[J]. Pattern Recognition,2015,48(4):1455-1464.
[3] Jia H,Ding S,Meng L,et al. A density-adaptive affinity propagation clustering algorithm based on spectral dimension reduction[J]. Neural Computing & Applications,2014,25(7-8):1557-1567.
[4] Dueck D,Frey B J. Non-metric affinity propagation for unsupervised image categorization[C]// IEEE, International Conference on Computer Vision. IEEE,2007:1-8.
[5] Wang K,Zhang J,Li D,et al. Adaptive Affinity Propagation Clustering[J]. Acta Automatica Sinica,2007,33(12):1242-1246.
[6] Yu X. Semi-Supervised Clustering Based on Affinity Propagation Algorithm[J]. Journal of Software, 2008, 19(11):2803-2813.
[7] Dong J. Affinity Propagation Clustering Based on Variable-Similarity Measure[J]. Journal of Electronics & Information Technology, 2010, 32(3):509-514.
[8] Jia H, Ding S, Meng L, et al. A density-adaptive affinity propagation clustering algorithm based on spectral dimension reduction[J]. Neural Computing & Applications, 2014, 25(7-8):1557-1567.
[9] 鲁伟明,杜晨阳,魏宝刚,等.基于MapReduce的分布式近邻传播聚类算法[J].计算机研究与发展,2012,49(8):1762-1772.
[10] Zhang Z, Wang B Q, Yi P, et al. Semi-supervised Affinity Propagation Clustering Algorithm Based on Stratified Combination[J]. Journal of Electronics & Information Technology, 2013, 35(3):645-651.
[11] Xu M L,Wang S,Hang W L.A Semi-supervised Affinity Propagation Clustering Method with Homogeneity Constraint[J]. Acta Automatica Sinica, 2015,(2):255-269.
[12] Zhou S B, Xu Z Y, Tang X Q. A method for determining the optimal number of clusters based on affinity propagation clustering[J]. Kongzhi Yu Juece/control & Decision, 2011, 26(8):1147-1152,1157.
[13] 倪志伟,荆婷婷,倪丽萍.一种近邻传播的层次优化算法[J].计算机科學,2015,42(3):195-200.
作者简介
荀振宇(1983-),男,硕士研究生,工程师,研究方向:人工智能。
王卫涛(1989-),男, 硕士研究生, 工程师。本文通讯作者:王卫涛,研究方向:人工智能。