基于AI产业的量化投资组合策略

2022-03-03 13:14王刚贞李文博朱家明
沈阳大学学报(社会科学版) 2022年1期
关键词:聚类股票因子

王刚贞, 李文博, 朱家明

(安徽财经大学 a.金融学院, b.统计与应用数学学院, 安徽 蚌埠 233000)

随着人工智能的不断发展, AI产业涉及的领域逐渐扩张。同时,由于我国金融市场的发展和人们日益增长的理财需求, 金融投资策略、金融计量模型等逐渐成为人们理财投资的重要工具, 这使人工智能行业可能成为资产投资的重点方向。资产评估是市场经济发展到一定阶段的必然结果, 对上市公司进行资产评估有助于对投资决策作出准确的判断。对于人工智能行业资产评估分析, 有利于弥补我国在资产评估规章制度方面的不足。

从宏观角度来看,对与AI产业相关的股票进行人工智能概念股领域的投资组合分析,可以发现当前人工智能行业存在的不足并加以改进完善,有助于人工智能行业的发展。从微观角度来看,对人工智能行业进行投资价值分析有两方面作用:一方面有助于人工智能企业决策投资者更好地了解自己企业的经营状况,便于更好地优化资金分配问题和投资组合;另一方面,投资价值分析有利于人工智能企业自身经营决策的确定[1]。目前,我国的人工智能市场尚不成熟,正确的经营决策可帮助企业解决各种问题。总地来说,对人工智能进行投资价值分析,既符合企业投资决策者的需要,也能满足广大股民想要获取收益的需求[2]。

一、量化选股

为了选出具有高成长性、高盈利性的股票,本研究采用量化选股的方式对个股的成长性、盈利性、偿债能力等方面进行分析,从109只股票中挑选出最优成长股构建投资组合,并运用量化投资方法使选取的股票更具有准确性和系统性。

1.备选股票池

为了使筛选股票的准确性更高,首先对人工智能行业的股票进行初步筛选。以净资产收益率(ROE)为初步参考标准,初步选出净资产收益率大于12%的29只股票加入本次进行量化投资的备选股票池,如表1所示。

表1 净资产收益率大于12%的29只股票

2.财务指标选取

筛选成长型股票,财务指标的选取是必不可少的,需要综合分析每个上市公司的成长性、盈利性、偿债能力和资本结构。衡量成长性的指标为营业收入增长率、净利润增长率和基本每股收益率。衡量盈利性的指标为总资产报酬率、营业利润率、净资产收益率和加权净资产收益率。衡量偿债能力的指标为流动资产比率和速动资产比率。衡量资本结构的指标为资产负债率。

3.主成分分析

在研究这些股票财物指标的过程中,多个财务指标之间难免会有相互关系,为了减少这种情况的出现,可采用主成分分析法来降低指标维度,合成少数几个相互无关的综合性指标。主要的分析步骤为:

(1)将原始数据按行排列成矩阵,具体数据见表2。

表2 财务指标数据 %

(2)计算标准化数据的协方差矩阵。

(3)计算特征值和特征向量。

(4)计算主成分的方差贡献率及累计方差贡献率,累计贡献率越大,表明主成分包含的原始信息越多。

(5)提取主成分因子进行主成分分析,具体分析结果见表3。

表3 主成分分析结果

利用MATLAB软件对10个指标进行主成分分析,得出如表3所示的结果。从表3可以看出:前4个指标的特征值分别是3.84、2.52、1.47、1.04;前4个指标的贡献率累计达到88.76%,超过85%,涵盖了大部分的信息。所以,确定了前4个指标为主成分,它们分别是成长因子、盈利因子、偿债因子和资本结构。

(6)计算出29只股票的主成分得分和综合得分,综合得分是各主成分得分的加权平均值,然后对得分结果进行排序,结果如表4所示。

表4 各股票主成分得分、综合得分及排名

根据表4中29只股票的综合排名,资金拥有量不同的人群会进行不同的投资选择。资金拥有量处于社会平均水平以上的投资者可以考虑对不同的股票进行组合投资,而资金拥有量处于社会平均水平以下的投资者可以考虑排名靠前的几只股票。

4.模糊C均值聚类

虽然主成分分析法给出了这些股票的综合排名,但是,并未对股票进行分类处理,这样会导致资金拥有量比较多的投资者进行股票投资组合时难以抉择。所以,需要利用模糊C均值聚类分析对这29只股票进行分类。

模糊C均值聚类算法是从传统HCM算法上改进而来的,是模糊聚类领域发展较为完善的算法,已成功应用于许多领域。模糊C均值聚类算法是按照某种规则,将具有同类性质的数据进行归类,转化为非线性优化问题,再通过迭代的方式进行求解[3]。对数据进行模糊C均值聚类,有助于投资者重点关注某一个类别的股票,从而构建更好的投资组合,获取更大的收益或及时止损。根据这些股票的成长因子、盈利因子、偿债因子和资本结构情况进行的聚类分析结果如表5所示。

表5 股票聚类结果

根据表4的主成分分析结果和表5的股票聚类结果,可以计算出每个类别的成长因子、盈利因子、偿债因子及资本结构。每一类的成长因子是其成长因子的均值。结果如表6所示。

表6 三类股票的主成分分析结果

根据表6中三类股票各主成分分析结果可以得出:第一类股票的4个主成分均是负值,不适合投资;第二类股票除盈利因子外均是负值,适合短期投资;第三类股票的盈利因子是负值,成长因子、偿债因子和资本结构均是正值,适合长期投资。

5.初步构建股票组合

由上述主成分分析和模糊C均值聚类分析可以看出,这两种方法的优缺点刚好互补。所以,为了得到更理想的结果,要将这两个方法加以结合。投资者不能根据某一方法的结果进行简单的股票投资选择,而要结合这两种方法构建一种最为理想的股票投资组合,本研究初步筛选了8只股票。选择汇金科技、富瀚微、景嘉微、二三四五进行长期投资,选择浙数文化、三六零、汇顶科技、同花顺进行短期投资。

6.初步筛选的股票的相关性

根据初步筛选的8只股票的相关数据计算出8只股票的相关性,见表7。

表7 初步筛选的8只股票的相关系数

从表7可以看出,这8只股票的相关程度均不超过0.7,最大的相关系数是景嘉微与富瀚微两只股票,相关系数值为0.678。这说明初步筛选的股票大体上比较适宜投资。股票间相关系数超过0.5可以近似为相同投资性质的股票。在初步筛选的8只股票中,二三四五与同花顺、富瀚微、景嘉微的相关系数,同花顺与三六零的相关系数,汇顶科技与景嘉微的相关系数,浙数文化、富瀚微、三六零、景嘉微的相关系数均超过0.5,说明这些股票不宜同时进行投资,所以在进行投资组合时需要注意。

7. 组合风格

运用同花顺软件对初步筛选的股票的组合风格进行分析,绘制出组合风格分布情况(见图1)。可见,该组合属于成长型小市值和成长型中市值的股票份额较大,说明初步筛选的股票组合是比较适合投资的。

图1 组合风格

二、投资组合构建

投资组合理论是由马科维茨提出来的,要解决的主要问题是如何在风险不确定的情况下分析和调整不同金融资产的投资比例,有效降低非系统风险,使选定的股票投资组合能分散投资风险,实现理想的最大化目标[4]。马科维茨有效前沿是建立在“均值-方差”组合理论之上的,是证券投资组合构建的基础。具体而言,是在禁止融券和无限制借贷的两种主要假设下,将资金进行不同收益的投资组合,以达到众多不同方差和期望收益的最佳组合,从而实现在一定的收益水平下对应的方差最小、风险最小,或者在一定风险的情况下投资组合的收益达到最大化[5]。投资者可以根据自己的偏好和自有资金情况考虑要选择的投资组合,以达到效用最大化。

1. 投资组合的有效前沿构建

投资组合最核心的部分是对投资组合中各资产赋予不同的权重,然后计算出不同权重比例组合下的收益与风险,从而有效地进行资产的分散化,同时获得更高的收益或者负担更低的风险。为了寻求资产配置的最优化配比,本文根据马科维茨理论模型,利用MATLAB软件,构建了8只股票组合的有效前沿,图2中从左到右的10个点依次为10种不同的投资组合方案下的结果。根据有效前沿的结果,得出8只股票具体的有效前沿数据,见表8。

图2 投资组合的有效前沿

表8 8只股票的有效前沿数据

由MATLAB计算结果得出的各分配方案如表8所示, 结论为三六零、富瀚微和景嘉微3只股票在投资组合中的占比较低, 接近于0。投资组合的分散程度越低风险越大, 越高则风险越小。

2.最优投资组合权重的确定

根据前面的投资组合有效前沿的10种不同投资组合方案,得到了关于同花顺、汇顶科技、三六零、浙数文化、二三四五、富瀚微、汇金科技、景嘉微这8只股票的不同投资权重,再利用效用函数计算这10种不同组合带来的效用情况。效用函数的计算公式为

U=E(r)-0.5Aσ2。

式中:U表示投资组合的效用;E(r)表示投资组合的预期收益率;A表示投资者的风险偏好或厌恶程度;σ2为投资组合的收益方差。选取A=-3、-2、-1、0、1、2、3,计算不同风险偏好下的投资者的效用,结果见表9。

表9 不同A值对应不同投资方案的效用

观察表9可以看出,无论是哪种投资组合,只要A值在逐渐增大,该种投资的效用就会逐渐增大。所以,投资组合效用最大的投资方案是第10种。结合表8的第10种投资方案情况可知最优投资组合权重,即93.75%的资产投资于同花顺股票和6.25%的资产投资于汇金科技股票,投资其他股票的占比均为0。这种投资组合方式既适用于风险偏好型投资者,也适用于风险厌恶型投资者。

3.投资组合的在险价值

在市场经济中,每个企业都会以利润最大化为追求目标,所以投资组合就显得很重要。与此同时,更多的企业家会更加关注投资组合的风险评价。本文提取8只股票1年内的每日收盘价,设每只股票均持有1万股,利用同花顺软件对这8只股票在不同置信水平下的在险价值进行测算,测算结果如表10所示。

表10 8只股票在不同置信水平下的在险价值和波动率

观察表10可知,一般情况下,误差值标准差越小的股票的在险价值越高,在某种程度上,符合高风险高收益的投资规则。测算每只股票分别在99%和95%的置信水平下的在险价值,有利于进一步考虑如何分配权重。

在99%的置信水平下,汇金科技的在险价值是最高的,其波动率也是最高的;浙数文化的在险价值最低,其波动率也是最低的。在95%的置信水平下,汇顶科技的在险价值是最高的,其波动率处于中等水平;二三四五的在险价值最低,其波动率较高。

从上述表述和表格中其他股票的在险价值可以看出,通过有效前沿数据和效用函数共同确定的股票同花顺和汇金科技是比较适用于投资的,说明构建的投资组合较为合理。

三、结 语

本文的投资策略在设计过程中针对了不同风险偏好的投资者,所以,无论投资者是风险偏好型、风险厌恶型,还是风险中性,都可以采用这样的方式筛选出适合自己投资的股票,并且在能接受的风险水平下,计算出资产的最优投资组合,进而对自己的资产进行合理分配,并规避风险和获得一定的收益。按照同样的方法,还可以得到一些适合长期投资的股票,对于这些股票,投资者可以考虑在股价较低的时候买入,在买入之后可以作为自有资产长期持有。对于适合短期投资的股票,可以在1个会计期间内多次进行买入与卖出。在适合短期投资的股票中,当日K线图中出现“早晨之星”的时候买入,出现“黄昏之星”的时候卖出,可以获得短期收益。

本次投资组合策略主要是基于股票的成长性、盈利性、偿债能力和资本结构等财务指标的综合得分进行概念股选取的。由于概念股的特殊性,其股价波动相较于其他板块的股票浮动较大,因此,基于各项财务指标进行概念股的投资选股尤为重要。

猜你喜欢
聚类股票因子
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
山药被称“长寿因子”
直径不超过2的无爪图的2—因子
巧解难题二则
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票