基于大数据的智能投顾方案研究

2020-05-13 14:15褚福银张秋林赵智豪杨路
电脑知识与技术 2020年8期
关键词:大数据平台

褚福银 张秋林 赵智豪 杨路

摘要:随着中国市场经济的不断发展,国民收入不断提高,国民投资热情高涨,投顾市场较为活跃但也面临诸多风险与挑战。现代高新技术也得到推广普及,两者相结合的智能投顾领域也成为热点,具有巨大的发展潜力。通过大数据背景下的数据获取,处理与分析,建立相应的金融模型,再通过大数据反馈来不断完善模型与算法,打造用户画像中心和金融看板,成为新的行业增长点。

关键词:智能投顾;金融模型;大数据平台

中图分类号:TP311

文献标识码:A

文章编号:1009-3044(2020)08-0003-02

美国金融危机,人工投顾弊端暴露,投资者寻求一种低风险高回报的高效投顾方式,智能投顾由此诞生并迅速发展。美国智能投顾企业主要由创业公司发展和传统的投资顾问转型形成,其将极其丰富的市场经验和成熟的运营模式结合,为客户提供完整的投资组合建议,并基于美国的国家体制和税收制度,能产生避税效应,这也加速了智能投顾发展。相较美国,中国的智能投顾行业处于萌芽期,具有起步晚,发展慢,制度不完善,监管力度不到位,平台发展不均衡等的问题。目前的市场主体平台主要是有三类:传统的金融机构,新兴互联网机构,独立结构,共约40多家,市场规模达到约642.9亿元。

但中国自实行改革开放以来,市场经济体制不断发展与完善,具有世界上最庞大的资金市场与投资机会,投资者数量位居世界第一,为智能投顾行业的发展提供了机会,同时,在国家鼓励“互联网+”的创新创业背景的政策支持下,智能投顾作为金融科技的代表领域,也是促进市场经济活跃,投资领域资本流动的重要源泉和新的增长点。从长远来看,智能投顾行业具有极大的发展潜力与提升空间。

1 股票池的搭建

股票池的质量在很大程度上影响着投资时的收益率,所以股票的筛选是分析过程中不可或缺的一部分。目前市场中,无论是综合指数还是成分股指数都只是分别代表着沪深两个市場的各自走势,而沪深300则反映了沪深两个市场整体的走势。为了更好地判断模型的超额收益,模型将沪深300的收益率作为的基准收益。而为了能够更加真实地观察股价的上涨下跌,以及让成交量更具有可比性,在数据上选择了能更准确描述市场波动的复权数据,除此之外,数据还过滤掉了停牌的股票,上市时间小于一年的股票以及换手率低于2%或高于18%的股票。

停牌的股票并不能作为用户投资的交易对象,这些股票是没有意义的;上市小于一年的股票虽然有概率会引起投资者们的注意,在刚上市期间受到各方“机构”的吹捧。但是这些股票所公开的信息量,并不能让模型与算法从多个维度对其进行全面的评估与预测,因此这些刚上市的企业的盈利能力,发展能力,营运能力,偿债能力,以及资产质量等重要指标,都无法进行准确地判断。简而言之,项目无法从基本面对这些刚上市的公司进行分析,而仅仅通过消息面对企业进行评估显然有失偏颇的。而谈到换手率,这是选择股票时不能避开的一个指标,其包含了当前市场大量的信息,为后续股价的变动提供了支持,是一个判断建仓的有力指标。一般而言,换手率过低说明该股股性过冷,买卖双方成交不积极,没有套利的空间也存在高度控盘的嫌疑;反之,换手率过高说明该股有存在对敲和对倒的嫌疑,有较高概率发生主力出货导致股价飞速下跌。

2 资本资产定价模型

经过对股票的一系列筛选,基本搭建出一个简单的股票池,但其质量仍参差不齐,并不能直接进行分析。为了提高股票池的质量,试图通过在许多金融文献中不约而同都将其作为研究对象的资本资产模型,对股票的价值进行判断。

资本资产定价模型描述的是风险与收益率的关系,因此,用证券的收益率与期望收益率比较以判断是否有获得超额收益的可能陛。对于式(1),无风险收益率,市场收益率,证券回报率可以通过Tushare接口调取数据获得,因此,市场风险溢价可得。但是口系数,以及预期收益率需要继续进行计算。

根据式(2),假如要计算单只证券的β系数,那么通过单只股票资产的收益率γi对同期市场的收益率γM和α进行回归分析便可求得。对其,可以利用SciPy库的stats模块,进行最小二乘法回归分析,求出口和d的值。之后,继续对期望收益率进行计算。

在式(3),市场风险溢价,无风险收益率,β系数都成了已知量,那么,根据这个式子,可以得出该股票的期望收益率,将其与证券的同期实际收益率进行对比,可以对该股票的价值进行判断——如果证券同期收益率高于期望收益率,投资者在外部因素不变的状况下获得更高的收益,所以这样的证券是被低估的;反之投资者获得更少的收益,即这样的证券是被高估的。将被低估的股票筛选出来就形成了需要的股票池。

3 多因子模型

将股票池搭建完成之后,利用聚宽平台提供的动态情景Alpha因子模型为基础对股票池里的股票进行二次评估。在资本资产定价模型当中更多地是通过技术面的分析方法,对股票进行评估,但这样的评估方法不够全面,因此,从基本面对其进行二次评估。

在动态情景Alpha因子模型当中,聚宽平台选出了对股票收益率显著性最为强烈的七个指标(EP,BP,SP,Turnovers,Prof-itGrowthRate.EquityGrowthRate.IVFF)对股票进行全面的分析。具体而言,首先将每只股票的各个因子与股票池里的股票进行对比排序,这是一个去量纲的过程,因为每个因子的单位不尽相同,所以无法对其直接进行加权。之后将各股因子的数据导入SPSS对其进行多因子模型分析,仍然需要对其进行去量纲处理,通过SPSS自带的数据处理功能,将数据处理成了单位一致的数据,接着将这些因子进行多因子分析,根据多因子返回的结果可知每个因子的权重,将这些权重带人之前去量纲的结果当中,最终能够算出每只股票的具体分数。

4 基于蒙特卡罗模型的最优风险资产组合

通过以上的思路,基本得出股票池里每一只股票的分数。最优风险资产组合理论的重心是利用组合投资将风险相对最小化而收益相对最大化。但是,对于不同风险承受能力的用户,风险最小化的概念是不同的,因此,通过分数将股票划分成三个等级(A,B,C)分别成为我们的三个风险等级不同的股票池。对于每个股票池,用蒙特卡罗模型对其进行随机的权重分配,接着通过风险资产理论计算出所有组合投资的收益率。计算组合投资的收益率与市场收益率的协方差再除以市场收益率,能够得出所有投资组合的B系数。最后通过图1,确定资产组合与资本是市场线的交点,即该风险承受能力下的最优风险资产组合。

参考文献:

[1]杨雅婷,我国智能投顾风险及市场发展研究[Jl.时代金融,2019(27):93-94.

[2]李姝锦,胡晓旭,王聪.浅析基于大数据的多因子量化选股策略[J].经济研究导刊,2016(17):106.

[3]苏翔宇,朱爱群.CentOS7下基于Nginx的反向代理及负载均衡研究与实现[J].现代计算机:专业版,2018(10):61-64.

[4] Prakash P,BijuR, MohanSowmyaKamath. Performance Analy-sis of Process Driven and Event Driven Web Servers.lEEE IS-C0 2015.

[5]温胜辉.Fintech背景下资产证券化发展趋势浅析[Jl.债券,2018(5):86-91.

【通联编辑:梁书】

猜你喜欢
大数据平台
全国耕地质量大数据平台设计
高校思想政治教育大数据平台运行机制探析