刘勇
摘 要:分类数据在我们日常的分析中比较常见,当探讨相异行业的服务与质量时,行业就成了分类的变量,这儿必然会遇到聚类分析与方差分析的方法。在证券业进行较为热门的行业回报率研究时,也经常会遇到聚类分析方法。本文主要研究了聚类分析的特征概念、评价,探析了当前金融投资业的现状,最后在应用方面进行了全面分析。
关键词:分类;金融投资;聚类分析
当前在金融投资中,聚类分析方法的深入研究有很大的价值。聚类分析指的是将整个的数据按组或类的形式逐渐分类,使得每一组的数据之间有着较强的相似或者相同性,而不同组或类之间差别更大。在聚类分析下,可以通过数据之间的相似度分析数据模式的分布和数据间的属性。聚类分析通过股票成长性与收益性的分析研究,以综合评价的指标分析与衡量样本中的相似度,这能够有效指导与分析金融投资。聚类分析是在基础分析上进行深入研究的,能够帮助投资者以准确的分析方法探讨股票的相关特征,预测股票变动趋势,让投资者进行合理、有效投资。聚类分析操作可行度强,受限少,比较适合金融投资分析者。
1 聚类分析相关介绍
1.1 分类与评价
聚类分析认为数据的集中研究与数据之间有着各种相似性,聚类不同于分类,因为分类是早先就知道了的,在数据的集中分析与学习后完成对数据的分类以及有效的学习。而聚类是事先没有任何先兆的,事先不知道要具体分成哪几类,聚类就是没有分类标志的有意义的类。比如信用卡中,在对持卡人的年龄、收入、信用状况可以将信用度分成高等、中等以及低等这几类,在对持卡人进行仔细分析、仔细判别后能够合理的规避风险。而聚类分类能够通过持卡人的信用额度、用卡次数、消费区域等将持卡人再仔细分类,通过信用资料使得双方获利。
聚类分析可简要分为系统聚类、动态法、分解法这几部分。聚类分析指的是样品聚类和类之间的距离然后将样品各自分类,算出距离然后合并,每减少一类再合成一类。分解法将样品先分成一类,然后再具体的细分。上两种方法计算量大,内存多,比较适用样本较小的单位。而样品较大比较适用动态法,动态法存在的目的是确定中心然后输入样品,看看样本的归属,最后再具体调整。
聚类用途较大,还有些算法的预处理。聚类的类形状各项迥异,不同的方法适用不同的类型。伸缩性是聚类的优先要求,它能处理百万数据。数据类型处理需要处理序数、名义和二元变量,低参数、高维数据,以及可解释的数据性都是数据的几种类型,聚类存在的意义是解决具体问题,便于解释与理解。
1.2 数据之间的相似性度量
聚类问题中涵盖了N个数据XI(I=1,2……n),其中每个数据均有多种属性,变量的多样性决定了取值的连续性。比如汇率、价格等能够以连续值表示的称其为连续变量,由于变量单位不同,其间很有可能差异悬殊,用聚类分析将数据统一处理,满足上述条件。在聚类要素的处理中,常见的有总和标准法、极差标准法、标准差标准法,实际中的分类对象较为复杂,需要将各个数据标准化。
1.3 层次聚类
层次聚类又称之为系统聚类,它对给定数据逐层分层,形成由数据为节点的核心,细分下来包括凝聚和分类两种方法。凝聚法是一种自底向上的方法,它们将邻近的点合并成一类,凝聚法以类与类的间隔为度,临近的类不断组合加入组成新类,直到得到核定值。根据类间距,一般可分为最大距离法、重心法、中间距离法、最小距离法。最小距离法比较适合条形和S形的,在算法中以最小距离合并起来,最小聚类和最大距离中的距离均是单调的,只有从聚类树形图中才能直接窥见聚类情况。与凝聚法相反的分析法把数据看成一个大类,然后再分步细化,将每个大类拆分下来,分成单分裂与多分裂,当然此类分裂法应用并不广。
1.4 分割聚类法
将数据集中化成K个子集,使每个子集中的点最大程度的相似,其中clara算法与K值算法是较为常见的,clara是用于处理大数据的,K中心点的算法有着自身优势,但算法较为复杂,且伸缩性差。此类方法往往抽取多类样品,输出最好的,这就要保证取样时的中心点是最好的,否则无法得到最好的聚类。K中心点中可随意选择K类点为主点,其余的点就是围绕在中心点附近的类。K中心点的方法不易孤立,且难度系数不容小觑。
2.针对金融投资业简要分析
我国投资业的起步较晚,存在着很多不尽人意之处。金融投资加速了货币的再分配,其中大部分货币的由来是储蓄,以前货币累计的方式是放在银行或者购买国债,现在金融产品的类型较之几十年前丰富了不少。就股票而言,证券公司为客户提供理财方面的服务,比如分析股票、托管账户,服务类型多样化,从中赚取手续费。外汇黄金的两方面获利来源于理财服务与点差佣金,在投资中要谨慎小心,防止不法分子的趁虚而入,注意安全问题。
3.聚类分析在金融分析和投资方面的应用
3.1 方差分析
方差分析又叫做变异数分析,这是由两个以上样本均数构成的,经方差分析研究多由波形图呈现。方差分析中的组别可能源于实验条件与随机误差,实验条件是由组间差异决定的,以变量的形式在各组之中存在着的。随机误差是组内差异,这是个体中的差异与测量的误差导致的。方差分析主要用于有显著差异的事物之间,在试验中经常会探讨到实验条件不同导致的试验结果,这通常是两种不同实验环境下样品的差异。在农作物研究方向、在医学对于疾病的防患中都可以方差分析法解决此类问题。复杂的事物往往会相互制约相互发展,方差存在的目的经过分析得出对事物决定因素的关键。方差的分析与研究可以具体的分为单因素的方差分析和多因素的方差分析。这两者的步骤基本一致,资料的组成设计以及分解的方式略有差异。
单因素的方差分析重点是研究变量水平对观测变量的影响,单个因素对于变量的影响被称为单因素的方差分析。比如按照地域分析妇女的生育率,按照学生生活费分析在校学生的食宿情况,按照天气条件分析农作物的产值,上述情况都可以利用单因素的变量分析得出。单因素分析中的第一步是观察哪些是观测变量哪些又是控制变量,第二步是利用数学方差解决问题,第三部按照变量与平方和之间的比例推测一边对另一边的影响。单因素方差分析法理解简便,变量控制水平的不同对观测变量的影响并不大,真正变量值的变动是由随机因素所决定的。
多因素方差是探究两个及以上变量对观测变量的影响,这种分析方法不仅考虑到了变量对结果的影响,还需要考虑因素之间的交互影响与作用,比如研究不同大棚中种植出来的苹果、香蕉、荔枝,研究水果的不同种类,研究不同的大棚使得各事物间性能完全不同,这些效应都是可以添加的,可能与别的水果而言,两个大棚差别微乎其微,这被称作交互作用。
3.2 聚类指标体系的选取
经对上市公司的基本情况分析后,选择了盈利指标、成长指标、股本扩张的指标。盈利指标中的总资产利润率能够直接反映公司的盈利水平,净资产收益率反映了股东投资的报酬大小。主营业务收益率等于主营业务利润除以主营业务收入,主要业务的收益率越大说明市场竞争中的优势越大,每股收益越高,获利能力就越强。成长指标中一般只有业绩好的公司才能看到其不断上升的成长性,净利润增长率=本期净利润/上期净利润-1,在这里上市公司的发展与积累取决于净利润。股市扩张指标中股本规模小的公司反而扩张能力更强,流通资本就属于逆指标,每股净资产反映了股东的权益额。
3.3 应用研究
我国股票市场近年来正在茁壮发展期,规范化、完善化必然是未来股市的大方向。投资者若想在股市中取得一定的收益,就必须认真分析此公司的历史发展以及现阶段的前景介绍。聚类分析能够合理指导与分析证券法,以最优的方法配合投资者能够大体把控股票的特征,确定投资的范围,预测股票的未来走向。
为进一步分析和论证,本文以上市股票为例,以SPSS软件随机选取了三十只股票进行研究,最后将其分为三类,经研究第一类股票收益低,几乎没有任何变化,每股净资产低,股本扩张相对低,发展不好,由负的主营同比增长与低的净利润同比增长发现此类公司已经没有成长空间,买进卖出很有可能亏本,投资价值不会过高。第二类股票成长性高,收益也可观,但经营现金流较低,资金周转慢,此类股票可以短期持有,以买进卖出赚取差价。最后一类股票前景广阔,有较强的扩张背景,可以长期持有。在聚类分析中的分组,组内样品差异小,组外差异大,为了验证聚类的分组效果可以方差分析再度进行验证。
4.结束语
聚类分析以及方差分析是数据分析以及分类检验中的重要方法,本文对聚类分析进行详细分析后探讨了其基本理论,以实验验证了有效算法。方差分析是数据试验中的重要手段与工具,是分析数理统计的最基本方法。方差分析主要研究自变量对因变量的相对关系,研究在指标下,因素的显著和不显著影响,最后得出有利的研究条件。方差的分析特性决定了社会领域中分类型与自变量的关系,能够方便使用。方差分析作为常见的统计方法,在质量控制在管理评估以及市场研究中应用广泛。通过对方差的应用,对总体均值比较与判断后,寻找到了实际工作中的价值。
参考文献
[1]刘长义,孙刚.基于聚类分析与模糊可拓AHP的中小企业信用评价——一个供应链金融的视角[J].现代管理科学,2011,(5):83-85.
[2]靳刘蕊.基于变化趋势相异性的金融时间序列函数聚类分析[J].经济经纬,2010,(2):66-69.
[3]许倩.聚类分析在金融投资分析中的应用[J].财经界,2012,(8):10-10.