另类数据在金融市场中的应用:以股票预测为例

2024-02-02 18:00:16石喆瑞
今日财富 2024年4期
关键词:检测工具另类股票

石喆瑞

股票市场是当前最重要的金融市场之一,股票价格的变动及预测是投资者在股票市场关注的焦点。本文基于另类数据的角度对股票预测的影响做出阐述,首先明确本文主要从另类数据的三个来源:个人数据、商业数据、检测工具获取的数据,进而阐述另类数据对股票预测的影响。现有国内外研究表明三类数据在不同程度上对股票预测都有影响,个人数据对股票预测的影响更显著,其中投资者情绪对股票预测有直接影响;商业数据可提供销售数据、信用数据等对股票市场有间接预测作用;检测工具数据更侧重对企业运营情况做分析来影响股价变动。但另类数据存在噪音大、显著性不足及由于另类数据在我国仍处于发展阶段,缺少相关法律监管等问题。

股票价格一直都是股票市场关注的焦点,能够精准预测股价或者变动趋势一直都是量化投资研究的热门方向。任何理性投资者都希望在购买股票时做出最佳决策,以达到自身利润的最大化。股票预测可以帮助投资者做出最优决策,降低风险,从而获得投资收益。较为精准地获取实时数据掌握股价变动趋势、准确地预测出股价对股票投资者尤为重要。目前股票预测的研究多数集中在如何提高模型的精准度上,常采用股票市场的历史数据预测股价的运动趋势。例如传统时间序列模型往往基于日度、周度或月度历史数据对股价走势进行预测,但是预测效果一般。同时传统的股票数据具有数据量大、非线性、复杂性等特征,因此传统的预测方法具有局限性,并不能适应股票市场的复杂变化。

科技的进步以及大数据技术在金融领域的使用促使传统金融机构纷纷投入到新技术改革与新模式探究当中,这为另类数据的出現和使用营造了良好的环境条件。同时现阶段新技术的发展能提供更多有效信息且区别于传统数据的另类数据逐渐引起人们重视。目前相关研究表明,另类数据对股票预测有影响。行为金融学理论及其发展证明了情感倾向会影响股市波动。普遍采用的传统数据广泛应用于金融领域,但很难出现新的优势。另类数据提供的信息往往能更好地被投资者所接受,作为传统数据的补充对股票预测的影响有重大意义。

本文对另类数据对股票预测的影响进行综述,主要从个人数据、商业数据、检测工具获取的数据三种不同角度的另类数据,分别对股票预测的影响来展开论述。但由于另类数据发展较晚,在应用与探索方面仍处于起步状态,因此对股票预测的影响方面的实证研究较少,所以在相关另类数据的的阐述中略显不足。

一、另类数据概述

(一)另类数据的定义

另类数据又称代替数据,最早出现在美国征信行业,是指区分于传统金融数据对投资者实施投资有价值、有益的信息数据。传统金融数据有公司的财务报表、政府披露的宏观经济指标等。随着科技的发展,一些非传统数据,例如某区域的天气情况、某消费者的消费记录、某投资者在社交媒体公开发表的言论等也逐渐引起人们的关注。

另类数据的特点是体积大、流动速度快、种类多。体积大体现为规模和数据传输量。另类数据产生的速度惊人,导致另类数据的规模和传输量很大;流动速度体现在获取数据的速度上。通常传统数据因有披露的过程导致时间周期较长,获得的信息也相对滞后。相比之下,实时或接近实时获取和传输的另类数据有着更强的即时性。所以在不考虑准确性的前提下,获取另类数据的速度是相当快速的,种类多体现在数据结构多样性。例如另类数据有图片、音频、数值、视频以及文本数据等多种式。

(二)另类数据的分类

目前金融领域应用的另类数据尚未有统一的标准,本文将另类数据按来源分成三类,分别是个人活动产生的数据、商业活动产生的数据、检测工具获取的数据。个人数据泛指个人与外界发生联系的过程中产生的数据,例如社交网络信息、产品信息、搜索记录、购物喜好等。商业活动产生的数据泛指在进行商业活动过程中产生的数据,例如物流数据、支付数据。也有另类数据公司采集的传统商业数据,如百货公司客流量、游乐场客流量等数据。检测工具获取的数据泛指通过卫星、灯光、天气等物理设备或方法采集的数据,例如利用卫星数据通过光感和热感采集工厂的开工、采集、运输情况。此外还有来自卫星定位、车辆轨迹采集的另类数据。

二、另类数据对股票预测的影响

(一)个人数据对股票预测的影响

情感分析对于股票预测的影响可以从宏观与微观两个方向进行研究,宏观多数指新闻层面的报道等,微观多数指个体在相关论坛发表的言论以及各种演讲等。个人数据可以帮助测算投资者情绪,即在微观层面对股票预测的影响,例如基于投资者交流帖子是通过文本数据中情感词汇进行识别和扫描提取了投资者情感;基于东方财富论坛的评论信息经过分词、去停用词等操作,利用RoBERTa 模型对文本数据进行特征提取,得出每日情感特征;基于新浪股吧等股票论坛的数据,结合文本分析及机器学习算法,构建互联网投资者情绪指标。此外,利用在线评论信息反映公司口碑来预测股价。Huang等人利用亚马逊网站的2004~2015年的640万消费者的1450多万条消费者评价信息进行研究,结果表明这些评价包含与公司未来现金流和股票收益相关的信息,能够为股票预测提供有价值的信息。

个人数据结合机器学习模型预测股价,提高了股票预测的效率。赵帅斌等人研究发现通过交流帖子得到的投资者情绪,使用投资者情绪增加模型输入新特征,实证表明引入投资者情绪的股价预测模型可以更好地预测股票市场走势。严冬梅等人的研究表明融合情感特征的预测模型可以提高股票预测的效果。Kanavos等人通过处理Twitter中的每日交流帖子获得公众情绪,结合卷积长短期记忆人工神经网络(Convolutional LSTM,Cnov-LSTM),研究发现在Twitter获得的情绪数据能预测特定股票价格的走势。许天阳基于新浪股吧的在线股评信息利用VAR模型、Granger因果检验以及FF四因子模型等方法得出短期内投资者情绪对股市有一定的预测作用。

利用个人数据测算的投资者情绪具有一定的时效性,同时情感特征具有一定的时间性。现有研究表明在一定时间内较长时间的情感均值可以更好地预测股票价格走势,一旦超过区间预测结果就会有所下降,并非使用更长时间的情感均值对股价的预测效果有正面效应。有相关研究表明,利用测算的交易日天数不易太长,通常使用前5~10个交易日情感均值预测效果较好。同时现有研究表明,虽然在短期内投资者情绪对股市有一定的预测作用,但证券市场走势很快便会反转回落。

(二)商业活动产生的数据对股票预测的影响

商业活动产生的数据通过公司销售情况对股票预测产生影响。Sumit Agarwa等人利用美国上市公司的信用卡消费记录数据研究表明分类销售提供了客户需求,同时与一个公司的股票定价相关。研究者对来自高FICO(美国个人信用评级)得分、高流动性和忠诚客户的支出有更强的回报反应。分类销售信息的传输速度比收益信息的传输速度要慢,而小公司或远离其终端客户的公司表现出更延迟的价格反应,调整后的客户支出的回报影响延伸到生产链上的公司。王正位等人研究表明,我国A股市场的线上销售数据具有投资价值。股票价格不能对线上销售数据中信息作出迅速反应,该信息没有及时纳入股票价格中。实时获取线上销售数据并利用其信息可预测未来股价收益并取得超额收益。廖理等人基于电商销售数据研究表明,财务信息透明度更高和投资者关注度更低的公司,往往对股价具有更强预测能力。

(三)检测工具获取的数据

卫星数据通过反应公司运营情况间接影响股票预测。相关科技公司为获取企业开工的真实情况,通过卫星遥感技术获取夜光数据和温度数据,掌握企业开工实时数据,显著降低造假风险;遥感卫星技术获取地面可见光数据以此分析地面人类活动情况,夜晚照明情况的夜光数据可以辅助追踪企业的經营活动。Katona等人利用美国零售店停车场的卫星图像数据,发现停车厂的汽车数量能反映公司运营状况进而能够预测公司基本面和股价。目前我国检测工具获取的数据还可以应用在测算出库存情况,例如矿石库存情况等进而为股票市场提供有效的信息。

天气数据通过间接影响投资者情绪从而影响股票预测。早在1998年我国学者就曾研究过天气与股价的关系,例如林建生研究表明天气不错是会影响股价的,但影响效果相对微弱。有研究者利用沙尘暴数据研究表明,沙尘天气的发生通过影响投资者情绪从而对股价产生影响,对于防沙治沙环保型企业产生正向影响,对污染型企业产生负面影响。Nana等人基于股票交易城市日AQI和雪球网站用户评论情绪数据利用GARCH模型进行实证分析,研究表明空气质量可以通过影响投资者情绪来影响股市。Donadelli等人利用风暴事件数据库的龙卷风地理参考数据结合VAR模型研究表明,龙卷风对当地居民收入有影响,同时股票收益有滞后的负面影响,但只是部分部门会受此影响。

此外,仍有其他检测工具获取的数据对股票预测的影响。例如Thasos公司曾监控特斯拉工厂员工手机实时位置数据分析特斯拉的股票情况,该企业将获得的手机信号数量预测特斯拉量产,并通过量产与销售状况等数据预测特拉斯的股票价格。

三、另类数据的不足之处

尽管目前相关方向的实证研究大部分都是显著的,但仍有不足之处。关于另类数据的不足之处主要体现在噪音大和显著性不足两个方面。噪音是指在事后证实是错误的信息。噪音大体现在有研究者在利用另类数据进行研究时发现,即使应用更先进的算法,但文本分析后仍有较大的噪音;社交媒体中个人发布的信息往往带有更强烈的主观色彩,容易造成较低的信噪比。显著性问题与定价因子相关,显著性水平是否显著与新定价因子与以往的定价因子是否相关有关,相关性越低,所使用的相关定价因子越显著。

另类数据的监管问题目前被人们广泛关注。由于监管体制的不完善,数据的获取、加工、使用等环节缺少相关法律的约束,数据泄露和不当使用的案例也时有发生。如果数据经不当获取或非法使用,将对个人隐私以及商业信息的安全问题产生威胁,甚至对国家层面安全产生威胁。未来对另类数据的获取、使用等环节进行立法规制是相当有必要的。

结语:

文本主要基于另类数据对股票预测的影响进行阐述。主要从另类数据来源的三个方面,个人数据、商业活动获取的数据以及检测工具获取的数据来综述另类数据对股票预测的影响。相关研究显示个人数据对股票价格预测有更显著的影响,投资者情绪尤其可能是解释股票价格波动的重要因素之一。融合情感特征的股价预测模型比传统预测模型更有效,采用个人数据作为传统数据的补充对股票市场有更显著的预测能力;商业活动数据可提供交易的信用水平、经济指数、实时获取的销售数据等对股票市场具有预测作用;检测工具获取的数据可提供遥感卫星红外成像辐射仪数据、夜光数据、温度数据掌握企业运营情况,进而对股票市场做出预测。但另类数据仍存在噪音大、显著性不足,以及由于我国另类数据还处于发展阶段缺少相关法律约束等问题,这是我们未来需要解决的问题。

另类数据逐渐走入大众视野,成为新时代经济活动中新的生产要素、支柱产业。高科技监测手段也面临各种挑战,比如卫星监测中不同地点的云层覆盖对图像精确度的影响。这些图像和信息往往需要经过复杂的加工步骤。除了卫星图像以外,其他监测工具如无人机、热像仪、手机地理定位等,也可能获取对投资决策、股票预测有用的信息,另类数据对股票预测的影响仍可以从这个角度进行分析。

在目前大数据迅速发展的背景下,另类数据在金融领域表现出独特的信息价值,受到越来越多从业者的重视。目前有些企业已经开始率先使用另类数据,这将对信息不对称有所影响。但由于目前另类数据发展较晚,在应用与探索方面仍处于起步状态,对股票预测的影响方面的实证研究较少,所以在相关另类数据对股票预测影响的阐述中略显不足。

猜你喜欢
检测工具另类股票
“另类四不像”登场
高温封隔器胶筒试验检测工具的研究
化工管理(2017年16期)2017-06-23 13:49:36
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票
德国Rosen公司发布新型漏磁检测工具
中国移动设计院自主研发安全检测工具
另类演奏家
环球时报(2009-08-17)2009-08-17 20:17:25
另类交通工具