赵芷澜
(天津市耀华中学,天津 300041)
量化投资是指利用数字量化手段和计算机编程来获得稳定收益的一种交易方式。它具有系统性、及时性、纪律性、准确性和分散化等特征,在海外已有超过30年的发展历史,其投资表现非常稳定。在国内,量化投资的市场范围和份额也在不断扩大,赢得了更多投资者的认同。量化投资技术基本上涵盖了投资的全过程,具体包括了量化选股、量化择时、股指期货套利、商品期货套利、套利计算、算法交易、资金分配、风险控制等多个方面。量化选股则是通过定量方式来评估一家公司的价值。
近年来,随着技术的持续发展和金融数据的不断创新,市场效率不断提升,多因子量化选股模型应运而生。多因子模型的综合有效性显著高于单个因子,建立在多个因子维度上的选股模型因其高稳定性和强持续性,避免了许多不科学的选股决策,显示出比单因子模型更广泛的应用范围[1]。作为一种广泛应用的量化投资策略,多因子选股模型从资产定价模型发展而来,综合考虑多种因素。它对市场波动敏感,能够根据最新的市场情况调整策略,是量化投资模型的一个重要部分[2]。然而,由于因子的适用性具有局限性,因子在不同时间对不同股票的收益率影响并不总是明确的。学术界通常采用回归法来检验因子对股票收益率的影响性,通过利用历史数据对因子进行回归分析,确定因子对收益率的正负影响,据此进行相应的策略调整。一旦因子的正负性被确定,它将保持不变[3]。本文将从盈利能力、成长能力、估值等多个维度筛选出有效因子,并借助Ricequant平台进行回测以进行筛选。通过淘汰相关性弱的因子并结合相关性强的因子,本研究旨在识别通常能帮助投资者提高收益的因子和组合模型。
“量化”这一概念源于国外,是一种将数学方法应用于财务领域而形成的全新思考模式,其发展并未伴随传统财务学的演进。美国经济学者马科维茨于1952年提出了“证券组合”理论。这是一种定性的“证券组合”方法,并首次将“量化”方法引入到证券组合理论中。该理论通过有价证券在某一时期的平均回报率来度量收益,并通过其标准差来度量风险。基于这一模型的假设,Markowitz提出了一个基于有效边际的资产优化分配模型。在Markowitz的投资组合理论基础上,Sharpe、Lintner和Mossin分别对资本资产定价模型(CAPM)进行了测试并进行了改进,最终形成了现代的CAPM理论,其公式为:
在此,rs代表投资组合S的回报变量;rM代表投资证券的回报变数;在目前的市场中,rf代表了无风险的收益;βs代表对市场风险的组合S的敏感性满足。
受CAPM模型的启发,Ross提出了以多因素为核心的套利定价理论。该理论将多因素作为核心,为后续的多因素股票选择提供了坚实的理论基础。从美国的数据来看,定量投资已经发展超过40年。定量投资始于1970年,而到了2001年,其规模已达到880亿美元。随后,定量投资的发展速度加快,使西蒙斯、肖等人成名。近年来,随着科技的持续进步和机器学习技术的发展,量化投资与算法之间的联系变得更加紧密。Vrontos等人采用机器学习方法进行建模,不仅能够综合各种统计指标评估模型,而且能够结合多种投资策略评价模型的经济价值。Markus等人建立了一系列通过不同机器学习模型进行验证的综合预测指标。结果显示,在所有机器学习模型中,流动性指标显示出一致性,而基于资产价格的基础面指标则排在第二位。由于零售投资者的参与,股票价格在短期内更易于预测,特别是在小型股票中更为明显。从长期看,大型股票和国有企业股票显示出较强的可预测性。我们采取单纯看多的策略,即便考虑交易费用,也能够获得可观的收益。
美国密歇根大学的Holland教授于1975年首次根据生物演化的原理提出了遗传算法。在随后的数十年里,这一算法被广泛应用于各种学科领域,尤其在金融投资方面表现突出。Chung等人通过分析现有的金融数据,构建了一个融合长短时记忆网络和遗传算法的股市预测模型。他们提出了一套系统化方法来确定LSTM网络的时间窗大小及其拓扑结构,并对股市数据的时序特征进行了深入分析。Bonde等人运用遗传算法和演化策略进行特征选择和权重优化。在此过程中,每个属性的输入根据其连接权重被放大,并通过sigmoid函数处理,旨在找到最佳的连接权重以预测股票的最高价格。实验表明,这种方法在各种情况下的预测准确率都超过了70%。陈诗乐等人在先前研究的基础上,利用遗传算法进行个股的特征提取,并结合LSTM和转换技术深入预测股票趋势,考虑了股票的时序特征。何盼等人提议将这两种方法结合使用于股市趋势预测,这样不仅能有效地减弱各自方法的不足,而且能避免陷入局部最优,从而显著提高股市趋势预测的准确性。
本文的所有数据均通过Ricequant平台进行回测,以我国的沪深300指数作为研究对象,并选取2020年1月1日至2023年1月1日作为回测的时间范围。在排除了因合并或重组等原因导致股票停牌、财务指标数据不完整以及数据异常的样本公司之后,本研究选择了其他上市公司的财务指标作为样本进行回测实验。
公司的成长能力反映了其扩展经营的能力和未来发展的前景。市场对公司产品的需求量大、所处行业的未来发展前景良好以及公司的业务扩张能力强,均表明公司具有较强的成长能力。成长因子是指反映公司中长期成长能力的指标。如果某公司的成长因子超出了同类其他公司,那么可以预期,该公司的股价在未来有较大的上升潜力。衡量成长能力的财务指标主要包括营业总收入增长率、利润总额增长率、基本每股收益增长率以及每股净资产增长率等。
营运能力指的是企业的经营运作能力,即企业利用各种资产获取利润的能力。从更广泛的角度来看,经营能力涵盖经营活动中可实现的各种经营功能。然而,从微观角度来看,经营能力仅代表一种经营活动,并不能直接反映企业对人力资源的运用效率。反映公司经营能力的指标包括总资产周转率、应收账款周转率和存货周转率等[4]。在因子库中,估值类因子是一个重要的指标。它帮助投资者通过对公司的估值来判断其当前股价是否合理,从而对公司的未来发展前景作出合理预测。估值类因子在不同行业之间存在显著差异。例如,市净率较低的股票通常具有较高的投资价值并且较为稳定,像制造业和银行业的市净率一般在1.5左右,而成长空间较大的科技公司则相反。在多次实验中,本文采用了定期轮动交易模型,并将调仓周期设定为5个交易日,最大持仓股票数量限定为10只。
在衡量公司绩效的指标体系中,成长性指标扮演着核心角色。公司的偿债能力(支付能力)、盈利能力,以及管理效率共同影响公司的成长性。公司的强大偿债能力是发展的先决条件,强大的盈利能力是发展的关键,而更高的管理效率则是发展的保障。将偿债能力、盈利能力和管理效率综合考虑,我们得到了公司的发展能力。经过多次回测,本文筛选了四个成长类因子,并为它们设定了相应的数值范围,实现最优的回测结果。净资产收益率,作为营业净利润率、权益乘数和总资产周转率的乘积,在利润水平发生变化时,必须识别影响净资产收益率的主要因素,以便能够及时反应并采取适当的对策来提升公司业绩。
因此,与单一财务比率分析相比,净资产收益率的驱动因素分析具有更高的价值。选股因子的取值范围见表1。根据表2的数据,本策略的回测收益为27.05%,相比基准收益的-1.94%,证明了本策略具有较优的表现。
表1 成长能力选股因子
表2 成长能力回测结果
图1展示了成长能力因子从2020年至2022年的收益变化情况,采用折线图的形式展示。根据图1,回测收益在2020年为27.50%,2021年为50.00%,而2022年为20.30%。相比之下,基准收益在2020年达到37.90%,2021年为73.00%,2022年为28.60%,整体呈现出先上升后下降的趋势。
图1 成长能力因子2020 年至2022 年收益变化情况
运营能力指的是公司整合各种资源以获得利润的能力。该能力主要通过分析和计算公司的资产周转率来衡量公司的经营和管理效率。在对企业的运营能力进行分析时,我们主要关注存货周转率、应收账款周转率、流动资产周转率和总资产周转率等财务分析比率。这一指标不仅能反映公司的资本运作情况,而且能揭示公司的运作效率和资源使用效率。
企业拥有强大的经营能力能够优化资产结构,实现资源的有效利用。同时,通过保持和改善财务状况,企业能够提升资金周转率,确保资金的正常流动。这为公司营造了良好的经营发展环境,使经营管理者能够做出正确的财务决策,让外部投资者能够进行合理的投资。此外,强大的经营能力还有利于稳定和改善财务状况,加快资金周转速度,为企业创造良好的经营发展氛围。这不仅让经营管理者能做出准确的财务决策,而且使外部投资者和债权人能进行理性和科学的决策。
一般而言,企业资金周转速度越快,其流动性越高,偿债能力越强,资产获取利润的速度也就越快。然而,在实际回测中发现,并非所有指标的数值越高就意味着企业收益越大。通过调整指标大小,我们发现当企业的总资产周转率处于1.5到2.5倍之间时,可以获得相当不错的收益。选股因子的取值范围见表3。回测结果显示在表4中,该策略的收益为18.97%,夏普率为0.8188,表明该策略拥有较优异且稳定的表现。
表3 营运能力选股因子
表4 营运能力回测结果
图2展示了营运能力因子从2020年至2022年的收益变化情况,以折线图形式呈现。数据显示,回测收益在2020年为37.00%,2021年达到73.81%,而2022年为65.17%。相比之下,基准收益在2020年为24.80%,2021年为20.59%,2022年则下降至-5.49%,显示两者之间的差距逐渐增大。
通过调整指标和指标的数值范围,在市盈率20到40,市净率1到1.5,市现率2到3之间,实现了年化收益率为17.71%,年化阿尔法值为17.36%的回测结果。相关因子的取值范围见表5,详细数据见表6。该策略的收益为17.71%,与基准年化收益-1.94%相比,明显展现出了其优异的回测表现。
表5 估值选股因子
表6 估值类因子回测结果
图3展示了估值类因子从2020年至2022年的收益变化情况,使用折线图形式。从图3可以观察到,回测收益在2020年为15.35%,2021年增至65.17%,2022年稍微降至60.18%。相比之下,基准收益在2020年为27.21%,2021年为20.60%,而2022年下降至-5.49%。在短暂的交叉之后,两者之间的差距逐步扩大。
图3 估值类因子从2020 年至2022 年的收益变化情况
经过多次回测,笔者发现样本的选择及选择的回测时间周期会显著影响回测效果。同时,选定的时间周期较短,并受到限定因素的制约,这些因素可能导致回测表现优异而与实际操作不符,以及对历史业绩的高估。此外,未来函数的问题,即在策略分析中使用了在回测历史该时刻尚未获得的数据,前视偏差可能使模拟结果更接近于测试的预期结果,导致策略制定者对其策略过度自信,误信模型具有高度准确的预测能力。这是一种错误的思维方式。但由于回测软件的限制,本研究未能解决该问题[5]。
鉴于这些局限性,未来的研究可以致力于降低多因子选股策略的风险和时效性问题,使选股策略具有更广泛的适用性。进一步,未来的分析可以增加样本量,并根据个人经验和市场状况进行相应调整与更新,以减少风险和由意外事件导致的大幅偏差,并在可能的情况下,使用滞后数据以避免前视偏差。
综上所述,本文通过基本面多因子选股策略,从成长能力、营运能力和估值三个维度对财务指标进行了实验,并得到了2020年到2023年的三个正收益回测结果。首先,本文选取了成长能力指标因子,包括净资产收益率、销售毛利率、销售成本率,回测收益达到99.68%,夏普率为0.967 7;其次,本文选取了营运能力指标因子,包括总资产周转率(同比增长率)、应收账款周转率(同比增长率)、固定资产周转率(同比增长率),回测收益为65.17%,夏普率为0.818 8;最后,本文选取了估值类指标因子,包括市盈率、市净率、市现率,回测收益达到60.18%,夏普率为0.670 5。值得指出的是,多因素选股虽具有风险性和时效性等特点,投资者在选择股票时必须根据自己的经验和市场环境进行持续调整与更新。然而,多因素选股建立在财务指标基础上,通过设定并筛选相关因子的数值来获得高收益的股票组合,具有一定的客观性,因而具有其价值。未来的研究可以着眼于改善风险性、时效性及无法准确描述现实的问题,开发出更加符合实际的模型,以解决当前存在的不足并完善选股策略。本文的研究成果为多因子基本面选股研究和投资者量化选股提供了有价值的参考。