大数据情绪指数与经济学研究:现状、问题与展望*

2018-01-24 18:30,
教学与研究 2018年5期
关键词:经济学情绪研究

,

传统经济学“理性人”假设的缺陷催生了聚焦经济主体有限理性行为的行为经济学,使得经济学的研究越来越多地依赖于实验和各种数据的搜集, 依赖于对人的心理分析, 依赖于对现实“经济人”行为的了解, 从而导致了有关市场主体情绪的研究逐渐成为经济学领域的热门话题。但经济主体情绪的测量始终是世界性难题,受到技术条件的限制,早期学者多使用实验、问卷调查的方法收集反映市场主体行为的数据,然后运用传统的统计方法计算情绪指数。囿于有限的样本量、抽样误差和实验的人为性,情绪指数的准确性备受质疑。2011年以来,大数据技术快速发展,互联网时代大数据的“全量数据”“真实数据”“实时数据”和“时空数据”等特点,突破了样本量和地理分布的限制,自然语言处理、数据挖掘和机器学习等技术使分析表征经济主体情绪的海量非结构化数据从而测度经济主体行为成为可能,[1][2]并能够基于此深入探究社交行为、信息传播、空间关联等因素在经济主体预期、偏好、消费行为形成过程中的作用。[3][4]因此,近年来,国内外经济学界通过对经济主体行为的测度来反映和量化经济主体情绪并基于此构建大数据情绪指数的相关研究方兴未艾。

所谓大数据情绪指数,是基于海量结构化和非结构化数据,依托机器学习、自然语言处理等数据挖掘、处理和分析技术构建的反映经济主体情绪的量化指标的总称,学术研究中常见的情绪指数、信心指数、满意度指数、幸福感指数、压力指数等都属于大数据情绪指数的范畴。作为经济主体行为的显化指标,大数据情绪指数渐进地打开了经济主体行为和预期形成过程的“黑箱”,拓展和深化了传统经济学的研究广度和深度,给行为经济学、行为金融学的实证研究提供了全新的思路,甚至在一定程度上正在引起经济学研究范式的变革。

随着互联网快速普及,信息技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,对大数据时代的经济学研究及其相关政策分析提出了许多新的课题。为此,习近平总书记在中央政治局实施国家大数据战略进行第二次集体学习时强调:“要运用大数据提升国家治理现代化水平,”“要充分利用大数据平台,综合分析风险因素,提高对风险因素的感知、预测、防范能力”*参见新华社:《习近平主持中共中央政治局第二次集体学习》,http://www.gov.cn/xinwen/2017-12/09/con tent_5245520.htm.。本文撷取大数据情绪指数这个大数据时代经济学研究的新动向,全面梳理了大数据情绪指数在经济学研究中的应用范围,并系统归纳了四种常见的大数据情绪指数类型,深入分析了大数据情绪指数的出现对传统经济学、行为经济学、行为金融学和媒体经济学产生的积极推动作用,同时也全面总结了当前大数据情绪指数研究方面存在的若干问题和争议,并在此基础上就其应用前景进行了科学展望。

一、大数据情绪指数在经济学研究中的应用范围

在社会科学研究中,经济学研究是最引领时尚新风的学科之一。大数据作为一种重要的工具,引入经济学研究是一种必然,由此经济学研究也会发生某种革命性的变化,值得高度重视。大数据情绪指数在现代经济学研究中应用最广泛的当属金融市场,大量文献研究了投资者情绪对金融市场交易行为、资产定价等问题的影响。同时,大数据技术的快速发展使得基于网络消费大数据编制消费者信心指数、基于网络及微博数据构建房地产投资者情绪指数、基于电子旅游服务平台的用户评论构建旅游市场情绪指数等创新研究层出不穷。

(一)大数据情绪指数在金融市场的应用

在20世纪30年代的大萧条时期,凯恩斯就曾提出过心理因素在人的经济决策中的重要性,强调人们在受理性经济动机影响的同时还受到非理性的“动物精神”(animal spirit)的支配,并将“动物精神”看作是经济波动的主要原因。[5](P161)在金融市场上,投资者情绪对金融资产定价的影响是学术研究关注的重点问题之一。在互联网时代,信息是投资者做出投资决策的重要依据,[6]人们获取信息以及人际互动的便利性也得到了显著提高,情绪传染使得社会大众情绪与股市之间的关系变得更加紧密。[7]因而,区别于传统的投资者情绪指数构建方式,来自于股票论坛、财经媒体、社交媒体的网络信息成为直接、实时地反映投资者情绪的载体,文本挖掘、主题分析和情感分析等大数据技术的应用使得根据网络信息构建投资者情绪指数,并探究其对金融市场的影响成为新趋势。目前大数据情绪指数在金融市场的应用是最多的,一些智能投顾(Robo-Advisor)平台甚至尝试把大数据情绪指数纳入资产组合模型中,提供具有鲜明“人工智能+大数据”特色的资产组合管理服务。

(二)大数据情绪指数在零售商品市场的应用

消费者情绪在零售商品市场上最常见的表现形式是消费者信心指数。随着电子商务、物联网、云计算等技术的发展,网上交易已经深入到人们的日常生活中,这些交易行为会以数据形式真实记录消费行为,因此近年来大量学者尝试基于网络消费大数据编制消费者信心指数,或研究其与传统的消费者信心指数之间的关系,或据此对未来的消费趋势进行预测。[8][9][10]

此外,运用网络大数据为反映消费者的通货膨胀预期和测度通货膨胀水平提供了新的视角。麻省理工学院网络价格指数(BPP)项目则利用网络交易数据探索更新CPI等指标编制方法,比较了基于网络交易价格编制的CPI指数与官方编制的CPI指数,认为网络交易数据的监测成本更低,其数据频度为日,能够缩小误差,数据范围和种类丰富且可以即时更新。截止2016年,该团队利用900多个零售商提供的约1 500万件商品交易数据为20个国家编制每日通胀指数,其宏观数据库则涵盖了60多个国家的900 多个零售商。*参见赵志龙:《“互联网+”对CPI的影响研究》,国家统计局网站,http://www.stats.gov.cn/tjzs/tjsj/tjcb/dysj/201705/t20170522_1496322.html.国内学者陈航(2014)也通过实证研究发现CPI指数和基于网络搜索行为合成的通货膨胀预期指数两者间高度相关,具有长期稳定协整关系。[11]张洋(2015)则提出了一些对短期CPI预测的新方法。[12]

(三)大数据情绪指数在房地产市场的应用

目前以大数据方法构建房地产市场情绪指数的研究相对较少,主要是利用网络大数据(包括电子化形式的传统媒体、搜索引擎、社交媒体、自媒体等)构建住房市场情绪指数预测房价波动。修(Soo,2013)和谷智彦(Tomohiko Taniyama,2013)基于主流报纸中的专栏文章或网站的专业板块上的新闻报道,测算出当地住房市场的情绪指数,并实证说明了其与当地房价波动密切相关。[13][14]随后国内也有学者利用我国知名门户网站新浪网的房地产频道中对样本城市的相关报道,并将其与相应城市房价的百度指数相结合,计算了样本城市投资者对房价的情绪等级以预测房价,[15]或基于微博数据构建房地产投资者情绪指数,[16]但考虑到数据可得性,这些研究中样本城市的选择往往集中于我国的一线或准一线城市。

(四)大数据情绪指数在其他领域的运用

社交媒体的发达极大地丰富了数据内容,各种服务平台和平台经济的建立也拓展了大数据情绪指数的应用范围。基于去哪儿网、携程网等电子旅游服务平台上的用户评论及游记,可以建立旅游目的地评价体系,分析游客情感特征,根据游客偏好为其更为精准地匹配和推荐旅游目的地。[17]分析公众在微博上对公共事件的情绪表达,政府能够及时掌握网民情绪的走向,可以通过自身或者意见领袖的积极引导促使事件向着良性方向发展,避免因公众情绪不稳定并进而产生集群效应所带来的社会问题。[18]

二、大数据情绪指数的类型

众所周知,数据结构决定编制方法和数据功能。大数据情绪指数的编制方法与传统方法相比有较大差异,而方法技术的差异往往是由于数据源的差异决定的。因此,本文根据所依托的数据来源不同,归纳了以下四种大数据情绪指数的类型。

(一)基于高频交易数据构建情绪指数

高频交易主要集中于金融市场,以股票市场和期货市场为代表,用高频交易形成的换手率、成交量和收益率等数据分析投资者情绪,尽管相对简单,但已经运用到了大数据情绪指数的思想。贝克和沃格勒(Baker and Wurgler,2006)指出,投资者情绪是一种不能被已有事实所证实的关于金融资产未来现金流和风险的信念,它是投资者的认知偏误在资本市场上的总体表现(Investor sentiment in the stock market)。基于此,他们采用封闭式基金折价率、IPO数量及其上市首日的收益率、交易量、股票发行量与证券发行量之比、股利收益等6个指标,运用主成分分析法构造了反映投资者情绪指数的BW指数。[19]国内学者马若微和张娜就运用上证A股月度IPO首日平均收益、IPO总量、总市值加权的换手率及上证A股每月新增开户数构建了反映市场投资者情绪的SENT指数,并分析其与上证A股市场指数之间的关系,说明投资者情绪与股票市场指数之间存在自我加深的循环作用,需要适度合理的政策来调节非理性情绪所造成的市场波动。[20]

(二)基于搜索引擎数据构建情绪指数

互联网时代,搜索引擎可谓网民获取信息的首要方式。通过搜索关键词反映出的经济主体个性特征、情绪态度和交易行为越来越多地映射到互联网空间,形成大量的结构化和非结构化的海量数据,反映出现实世界里经济主体需求、兴趣和关注的内容及强弱。[21]因此,国内外一些学者在研究中开始使用搜索引擎数据来构造指标度量市场主体情绪。国外学者大多基于Google提供的数据构建情绪指数,[22]如预测股票市场波动的FEARS(Financial and Economic Attitudes Re-vealed by Search)指标、预测美国房地产按揭贷款的违约概率和风险敞口的“住房压力指数”和反映中国35个大中城市居民对当地住房市场前瞻和预期的“信心指数”。[23][24][25]国内学者则主要基于百度搜索数据进行指数构建,其中以俞庆进和张兵(2012)、孟雪井等(2016)利用百度指数作为投资者关注度指标研究其对股票市场的影响,以及董倩(2014)使用百度指数预测我国16城市房地产价格较为典型。[26][27][28]

(三)基于媒体报道数据构建投资者情绪指数

与搜索引擎完全客观地记录和呈现不同,媒体报道既反映社会公众的意见,又为了追求经济效益而对内容进行筛选,从而带有一定的主观情感倾向。[29](P55)媒体报道传递出的对某一事件的态度和建议即构成了所谓的“媒体情绪”,并易于成为社会“主流意见”引导公众情绪。[30]因此基于媒体报道构建情绪指数,也是国内外学者常用的方法。早期,证券市场研究人员通过阅读主流财经报纸上的报道,判断机构、分析师甚至个人投资者的投资观点,在此基础上构建市场参与者情绪指数。[31][32]随着纸媒电子化和自然语言处理、情感分析等大数据技术的应用,文本分析方法被广泛应用于构建各类资本市场情绪指数,并实证发现这些指数能够对市场交易行为、资产定价产生显著影响。[30][33]类似的手段也被应用于房地产情绪指数构建,具有代表性的是前文述及的修(Soo,2013)和谷智彦(Tomohiko Taniyama,2013)分别基于美国和日本主流报纸中的专栏文章或网站的专业板块上的新闻报道所测算出的住房市场情绪指数。

(四)基于社交平台数据构建情绪指数

随着各种移动终端的普及,越来越多的网民在互联网社交平台上获取信息并发表观点。由这些信息和观点形成社交平台数据,兼具了主要反映个体行为的搜索引擎数据和主要反映组织行为的新闻媒体数据的特征,往往能够更直接地反映公众的关注度和情绪。[34]因而也成为构建情绪指数的重要数据来源。欧美学者多使用Twitter或Facebook作为数据来源,基于Twitter用户活跃度、用户结构等特征构建的指数被发现与股票市场间有很强的相关性,[35]基于Facebook个人用户状态中表达情绪的词汇构建的国民幸福指数(Gross National Happiness)同样被证实能够有效预测美国股市的未来走势。[36]国内学者运用微博数据的研究较常见,主要用于股票市场、房地产市场投资者情绪指数的构建,[37][38]近两年还出现了运用中文微博情感分析方法计算公众环境情感指数和公民幸福指数等更贴近民生问题的研究。[39][40]随着电子政务的发展,情绪指数研究进一步拓展到行政管理领域,石磊(2016)采用文本分析法构建的地方政务微博服务公众满意度指数,较好地反映了公民对地方政府信息化建设的满意程度。[41]

三、大数据情绪指数与经济学理论研究

随着新经济的蓬勃发展和网络时代的到来,各类经济主体的社会经济行为逐步数字化、网络化和自媒体化,构成了经济行为的自然实验,形成高速、实时、多样化等特征的海量数据集合或信息资产,即大数据。基于海量结构化和非结构化数据,依托机器学习、自然语言处理等数据挖掘、处理和分析技术构建反映各类经济主体的大数据情绪指数,有可能渐进地打开了经济主体行为和预期形成过程的“黑箱”和“灰箱”,拓展和深化传统经济学的研究广度和深度,给行为经济(金融学)学的实证研究提供了全新的思路,并有助于定量测度媒体传播能力及其社会影响力,深化媒体经济学中有关经济主体媒介接触和媒介消费行为的研究。

(一)大数据情绪指数对传统经济学的可能贡献

1.大数据情绪指数使量化经济主体行为成为可能。

传统经济学的主要结论均建立在诸如“理性经济人”等一系列严格的假设条件之上,这与现实世界并不完全相符,难以反映微观市场主体的行为差异及其在经济运行中的作用。在数字经济和网络时代背景下,逐步数字化、网络化和自媒体化的各类经济主体行为,其数据的普遍性、真实性、覆盖性、交互性和可测性为经济主体行为信息的获取和量化提供了便利。传统量化经济主体行为的方式主要有直接指标测量和间接指标测量。直接指标测量是以问卷调查形式诱导主体暴露出预期,[42][43]但是这种方式易受到样本量、地理分布或时间频率和主观因素的限制;[13]间接指标测量是从市场相关数据中提炼出代理变量,然后用主成分分析法等统计学方法构建指数。[19]这种方式有一定的说服力,但或因遗漏变量而难以完全反映投资者情绪。互联网时代大数据的“全量数据”“真实数据”“实时数据”和“时空数据”等特点,突破了样本量和地理分布的限制,数据挖掘、自然语言处理和机器学习等技术使得运用大数据情绪指数对直接表征经济主体行为的、自然观察的、具有高度的时效性的信息进行全样本分析成为可能,较之政府或其他机构借助统计调查和主成分分析法获得的信息,更具客观性和真实性。

2.有望渐进打开经济主体预期形成过程的“黑箱”。

尽管宏观经济学中有专门关于预期的理论阐释,但是,一方面主流经济学的理性预期概念备受诟病,另一方面因预期难以测量而呈现适应性预期、理性预期及有限理性预期的争论,导致经济主体预期形成过程仍是“黑箱”。[44]当前对于预期形成的理论解释主要有信息刚性理论和适应性学习理论。[45][46]信息刚性理论假定投资者仍是完全理性的,只因不愿或不能及时更新和完全掌握所有信息而难以保持理性,导致了有限理性。适应性学习理论则认为投资者本身是不完全理性的,信息在公众间传播,投资者通过相互学习,不断调整预期。[47]两个理论都需要设定数学模型从理论上解释预期的形成过程,[48]但限于传统方法难以科学地量化预期,两个理论均缺乏实证检验,[49]因此预期形成机制仍是“黑箱”。基于大数据构建情绪指数,为测量预期和量化市场主体情绪提供了新的路径,有望渐进打开经济主体预期形成过程的“黑箱”,拓宽了传统经济学的研究视野。

3.大数据情绪指数有助于提高传统经济学理论模型的广度、精确性和时效性。

传统经济学中实证分析主要依靠结构化数据,大数据技术则将文本、图像,甚至声音、视频等大量海量非结构化数据都作为构建情绪指数的数据来源,而且呈现出两大特点:一是对传统研究方法难以测量的人类活动例如人际关系、社交网络可以构建大数据情绪指数进行统计分析,扩展了传统经济学理论模型的广度,研究对象不断多元化,研究方法更丰富。此外,结构化数据的一个明显缺陷是其具有很强的时滞性。大数据超高时效性的特点有效弥补了这一缺陷,数据可以实时获取。互联网、社交媒体上的数据更是实时更新。较之于传统的情绪指数构建方式,大数据情绪指数运用数据挖掘、自然语言处理和机器学习等技术,基于文本、图像,甚至声音、视频等大量海量非结构化数据来构建,大大提高了时效性和精确程度。将表征经济主体行为的大数据情绪指数纳入传统经济学理论模型进行分析,使传统经济模型可以充分利用实时数据,提高分析或预测的时效性,为经济预警和政策制定提供最快速的资料和依据。[50]大数据情绪指数将有助于提高传统经济学理论模型的广度、精确性和时效性,对分析宏观经济形势和制定经济政策具有重要的意义。

(二)大数据情绪指数对行为经济(金融)学的可能贡献

1.有助于有限理性和心理账户等行为经济(金融)学基本概念的量化。

行为经济(金融)学通过证伪新古典经济学“理性经济人”的公理化假定,运用有限理性和心理账户等概念形成其行为决策理论。虽然行为经济(金融)学逐渐获得广泛认可,但是囿于其研究的重点仍停留在对市场“异象”的质疑和投资者心理认知偏差的定性描述和历史观察上,缺乏对有限理性和心理账户等行为经济(金融)学基本概念的量化而不断受到主流经济学界的质疑,成为其致命的弱点。行为经济学很长一段时间停留在理论阶段,难以进行实证分析。实验方法一定程度上缓解了行为经济(金融)学的尴尬处境,但实验研究成本高,且受实验对象主观因素影响较大。运用大数据方法构建情绪指数则为有限理性和心理账户等行为经济(金融)学基本概念的量化提供了新思路,从而为行为经济(金融)学的实证分析创造了条件。同时,基于大数据构建情绪指数已经在一定程度上突破了数据本身,数据挖掘技术并非传统意义上对某些假设的验证,而是一种提出假设的过程,其思路更接近数据生成过程本身,具备先验和智能性质。[51]人工智能的发展促使行为经济(金融)学向更高级的智能经济学发展。

2.运用大数据情绪指数科学量化投资者个体行为和投资者群体行为。

相对于行为经济学其他分支,行为金融学更关注投资者情绪对其交易行为的影响。行为金融学理论认为,偏好和投资理念异质的投资者在投资过程中往往是非理性的,并且由于模仿学习、情绪传播等社会互动机制的影响及场内有限套利情形的存在,将可能导致市场中资产定价偏离一般正常水平。因此,行为金融学的核心内容之一是对投资者情绪的研究,即科学地量化投资者情绪,测量投资者的非理性行为。投资者情绪是行为金融学的理论基石之一。

基于大数据构建投资者情绪指数是近年来行为金融学研究的新趋势。随着互联网大数据时代的到来,行为金融学进入海量数据的大样本时代,数据类型的多样化则使投资者情绪指数的数据来源日益丰富,解释能力逐渐提高,采用数据挖掘技术从网络用户行为中提取投资者情绪指数更为客观、实时和精准。同时,投资者之间的模仿学习、情绪传播也会通过网络用户行为的大数据信息呈现出来,有助于显化和刻画“羊群效应”等个体理性行为如何形成群体非理性行为,最终导致个体主观决策的结果有悖于个体预期效用的社会现象,从而了解投资者情绪形成、扩散和作用机制及对金融市场的影响,解析经济个体决策行为和决策过程的“黑匣子”及金融市场的风险定价机制。

3.有助于把“有限理性”投资者个体行为和投资者群体行为纳入资产定价模型中,推动行为经济(金融)学形成成熟统一的理论体系。

综上所述,大数据情绪指数既有助于有限理性和心理账户等行为经济(金融)学基本概念的量化,又可以测量投资者个体行为和投资者群体行为,基于此,可以把“有限理性”投资者个体行为和投资者群体行为纳入资产定价模型中,分析其对资产价格的影响,从而对主流金融理论的资产定价模型起到了良好的修正作用。近年来行为资产定价模型( Behavioral Asset Pricing Model,BCPM)和行为组合理论( Behavioral Portfolio Theory,BPT)已经尝试把“有限理性”和投资者行为的研究成果融入传统金融理论常用的资产定价模型中,大数据情绪指数通过有限理性和心理账户及投资者行为的量化,将推动纳入行为因素的资产定价模型的完善,有利于行为经济(金融)学形成成熟统一的理论体系。

(三)大数据情绪指数对传媒经济学的可能贡献

1.大数据情绪指数有助于深化对经济主体媒介接触和媒介消费行为的研究。

传媒经济研究不仅需要传统的经济学理论,也需要社会学理论、网络科学理论等其他学科理论。社会网络化和经济数字化的发展趋势使得经济主体之间的行为、观念、感情的相互影响逐渐增强,社交媒体是重要的信息传播中介,也是经济主体情绪显化的重要途径,传媒经济学研究价值和意义日益凸显。然而,由于真实世界中的社交关系和社会影响往往是难以观测的,社会影响的形式也往往是复杂而多样的,对经济主体之间社交影响的实证研究受到了很大的限制,[52]这也极大制约了传媒经济学理论的前进。

依托于社交媒体信息构建的大数据情绪指数,虽然基于在线上的虚拟世界中重构的社会关系,但却真实还原了经济主体的思想和行为,使个体之间的联系突破地域、时间等方面的限制,又与现实世界产生千丝万缕的联系,为研究社会网络中的社会影响现象提供了一个较为理想的实验环境。通过挖掘各类社交媒体的数据,借助于人工智能技术构建大数据情绪指数,有力地推动研究者借助社会学理论和社会网络研究理论,把个体纳入一定的社会结构和社会情境中,考察个体镶嵌其中的社会关系因素如何影响个体的媒介接触和媒介消费行为,研究影响个体行为的各种因素及其影响机制,揭开人们媒介接触和媒介消费行为的“黑箱”,从而深化传媒经济学理论研究。

2.大数据情绪指数有助于定量测度媒体对各类信息的传播能力及其社会影响力。

情绪指数是传媒经济学实证研究的重要工具,构建情绪指数是将经济主体的心理活动、思想倾向以及社会影响进行量化的重要途径。传统的传媒经济学研究中,主要的研究方法包括抽样调查、内容分析、假设检验、实验研究等,这些方法均受制于研究条件和数据可得性,难以准确地实现媒体对各类信息传播能力及其社会影响的定量测度。[53]因此,传媒经济学的发展亟须学者设计和运用新的研究方法与研究工具来提高情绪指数的质量。

大数据情绪指数充分尊重信息不对称这一市场的基本特征,最大程度地还原了信息通过媒体进行传播的过程,通过对受众的媒介接触行为和媒介传播行为进行准确的追踪分析,从更微观的层面量化媒体对各类信息的传播能力,以及不同经济主体在信息传播中作用和影响力的差异,从而更加真实地以数字化形式描绘出媒体本身在信息传播中除作为中介渠道之外的综合效应,以及经济主体利用媒体对其他经济主体施加心理影响的过程。进一步地,大数据情绪指数通过对不同经济主体接受信息广度和深度的刻画和对不同媒体社会影响力大小的准确测度,使研究人员能够据此对社会公众对某一政策、事件或行动的预期做出预测,并利用对未来预测的结果指导现阶段对媒体工具的利用、改造和引导。

四、大数据情绪指数存在的问题、争议及未来展望

任何新生事物都有不成熟的方面,需要在今后的实践中不断发展和完善。大数据情绪指数相对于传统方法构建的情绪指数具有诸多优势,但大数据方法本身仍存在一些待解决的问题,对大数据方法在经济主体心理活动和行为机制研究乃至在整个经济学研究中的作用和定位也存在一些争议,这些问题和争议一定程度上削弱了学术界对大数据情绪指数的认可程度。但是,随着计算机科学和信息技术的发展,大数据广泛应用于经济学研究是大势所趋,大数据方法与经济学理论及研究范式未来将会更加有效地融合。

(一)大数据情绪指数本身存在的问题

首先,基于大数据构建情绪指数的基础在于数据的可得性,但政府部门、科研机构掌握的优质数据资料不轻易公开。这一方面造成大数据的数据源产生缺失,另一方面由于这类数据通常被认为是比较权威的指标,也影响了大数据情绪指数的可信度和说服力。不过,随着未来政府部门、科研机构掌握的优质数据源渐进公开,将不断提高大数据情绪指数的可信度,增强其说服力。

其次,网络数据中的噪音问题也始终是数据处理过程中困扰研究人员的一个问题。某种程度上说,大数据的大容量是一把双刃剑,数据体量大虽克服了抽样误差,但其中难免包含了大量噪音。由于现阶段大数据情绪指数的构建通常借助于自然语言处理方法进行文本分析,而中文的语义分析和情感分析相对于英文更加困难,以目前的技术手段,在数据清洗过程中很难将噪音完全消除,这对大数据情绪指数的准确程度产生了一定的负面影响。

最后,大数据情绪指数难以复制。互联网时代,经济主体的每一个行为都能够转化为数据被记录下来,因此数据每天都在不断产生和累积,特别是网络数据,几乎是时时更新。这种数据的时效性一方面使大数据情绪指数克服了传统方法的时滞性缺陷,但同时也使得基于此构建的情绪指数难以复制。这在一定程度上影响了有关大数据情绪指数的研究结论能否被广泛认同,以及能否上升为成熟的经济学理论。总之,从方法创新到理论突破,大数据情绪指数仍然任重道远。

(二)大数据情绪指数在经济学研究中存在的争议

首先,学术界对于大数据有基本共识但尚无明确统一的定义,因此研究人员对大数据及大数据方法的理解和解读还存在分歧。部分学者过分强调大数据之“大”,只关注扩大数据源,仍固守传统分析方法;也有部分学者只强调数据处理技术的应用,将主题分析、情感分析等具体方法与大数据情绪指数概念画等号。这些认识上的分歧使得学术界对大数据情绪指数能否科学反映经济主体行为以及大数据应用于经济学研究的方式、方法及态度存在差异。

其次,学术界对大数据方法对经济学研究的作用定位仍有争议。有学者认为这是经济学研究范式的一次革命,将彻底改变传统的统计学和计量经济学方法,推动经济学研究进入数据驱动范式时代,更有学者提出了“大数据经济学”概念,认为它是一门涉及应用经济、统计学、管理工程、计算机科学与技术、软件工程、情报学、心理学等学科的新兴交叉学科,甚至提议将其作为与理论经济学和应用经济学并列的一级学科。[54]也有学者认为大数据方法更多体现在方法创新上,与传统经济学研究方法是互为补充和相互促进的关系,而非替代关系,基于大数据编制的指数包括情绪指数能够为传统统计调查提供佐证、补充,乃至相互融合。[55]

最后,学术界认为大数据情绪指数只能验证其与因变量之间的相关关系,而无法解释因果关系。[56]由于市场上发生的一切变化都可能对经济主体情绪产生影响,而经济主体情绪又通过影响其行为导致市场变化,因此在运用情绪指数解释某些经济现象时很难将其他变量的影响剥离开来,也就难以把大数据情绪指数作为因果分析的工具。

(三)未来展望

尽管存在上述问题和争议,面对信息时代社会网络化、经济数字化及计算机科学和信息技术的快速发展,大数据广泛应用于经济学研究是大势所趋,大数据方法未来将更加有效地与经济学理论及研究范式融合。展望未来,大数据情绪指数作为经济主体行为的显化指标,其构建过程将更为科学精确,从而能够更准确地揭示经济主体预期和行为的形成机制。

首先,经济学理论将为大数据情绪指数编制提供更多的指导。已有学者在反思现阶段大数据研究中存在的“数据→数据”的研究思路,旨在强调即便在大数据时代,经济学理论在大数据情绪指数研究中仍然具有基础性作用,大数据方法离不开经济学理论的指导。今后的大数据情绪指数研究中将更重视回归经济学理论,发挥经济学理论在决定数据选取等带有先验性主观性质的内容时所起到的指导作用,如为初步选择关键词和初步设定算法提供理论线索。

其次,大数据方法技术将进一步成熟。随着机器学习、自然语言处理等数据挖掘、处理和分析技术的不断进步,在数据采集过程中的噪音或将逐渐降低,从而使得数据质量得到显著提升,更为贴近现实世界,提高大数据情绪指数及其他大数据指标的有效性。此外,大数据预测可以借鉴在经济学中已经很成熟的小样本数据质量控制方法,从而减少因数据偏差所引起的预测错误。国家对大数据平台建设和人工智能发展的重视,也将使得一些权威的优质数据库逐步开放,使学者可以借助官方统计或调查所得出的传统数据与大数据情绪指数进行对比分析。

再次,基于大数据方法的因果分析应更受重视。现阶段大数据的分析预测更多来源于数据本身,因而得出的结论往往只能揭示变量之间的相关性。相关性是因果性的前提,为了更好地解决实际问题,下一阶段大数据方法如何在经济学理论指导下探寻事物之间的因果关系,将成为其在经济学研究中亟待解决的重要问题。实际上,目前一些大数据情绪指数的研究人员已经认识到了因果分析的重要性,并开始尝试在理论层面纠正模型设计的偏差,以经济学理论指导改进大数据情绪指数编制方法,探究经济主体情绪和行为之间的因果机制。

最后,大数据情绪指数将为完善经济学的理论研究提供新的路径。一方面,大数据情绪指数为重新确认经济学模型中的约束条件提供了可能性,或将放松传统经济模型的某些约束条件,使其更加符合现实世界,提高模型解释力。另一方面,基于对市场主体行为和预期形成机制的分析将推动行为经济学理论的发展,使其从理论分析进入实证分析阶段。如对投资者情绪在资产误定价过程中作用的分析有助于改进传统的资产定价模型,从而完善行为金融学理论。

总而言之,以大数据情绪指数研究为契机,打开经济主体行为、经济主体预期的“黑箱”,不断降低对经济主体行为认识的信息不对称,探究经济主体有限理性预期行为的形成机制,为经济学发展带来了前所未有的机遇,将推动经济学研究向更深层次发展。可以期待,大数据时代的经济学可能将会由此发生重大变革!

参考文献:

[1] Armah, N.A. Big data analysis: the next frontier[J]. Bank of Canada Review, 2013, Summer.

[2] Naimi A I, Westreich D J. Big Data: A Revolution That Will Transform How We Live, Work, and Think[J]. Mathematics & Computer Education, 2013, 47(17).

[3] Einav L, Levin J. Economics in the age of big data[J]. Science, 2014, 346(6210).

[4] 蔡庆丰, 郭春松, 陈诣之. 大数据思维在金融学研究中的运用[J]. 经济学动态, 2015, (3).

[5] Keynes J.M. The General Theory of Employment, Interest and Money[M]. London: Macmillan, 1936.

[6] 林全盛. 网络信息与股票市场的相关性探究[D]. 成都:西南财经大学, 2016.

[7] 赖凯声, 陈浩, 钱卫宁. 微博情绪与中国股市:基于协整分析[J]. 系统科学与数学, 2014, 34(5).

[8] 孙毅, 吕本富, 陈航. 大数据视角的通胀预期测度与应用研究[J]. 管理世界, 2014, (4).

[9] 董现垒, Bollen J., 胡蓓蓓. 基于网络搜索数据的中国消费者信心指数的测算[J]. 统计与决策, 2016, (5).

[10] 刘伟江, 李映桥. 网络消费者信心指数和经济增长的动态相关性研究[J]. 财贸研究, 2017(5).

[11] 陈航. 基于网络搜索的消费者信心指数构建及应用研究[D]. 北京:中国科学院大学, 2014.

[12] 张洋. 大数据背景下CPI短期预测[J]. 中国统计, 2015, (12).

[13] Soo C K. Quantifying Animal Spirits: News Media and Sentiment in the Housing Market[Z]. The Stephen M. Ross School of Business at the University of Michigan Research Paper Series,2013.

[14] Tomohiko Taniyama. Nowcasting the real estate market with news articles and Internet search data[Z]. Nomura Research Institute Report, 2013.

[15] Sun D., Y. Du, W. Xu, M. Zuo, C. zhang, J. zhou. Combining online news articles and Web search to predict the fluctuation of real estate market in big data context[J]. Pacific Asia Journal of the Association for Information Systems, 2015,6(4).

[16] 苏志. 公众预期与房地产市场的短期相关性——基于微博信息的实证研究[J]. 经济与管理研究, 2016, 37(3).

[17] 刘逸, 保继刚, 朱毅玲. 基于大数据的旅游目的地情感评价方法探究[J]. 地理研究, 2017, 36(6).

[18] 鲁艳霞, 吴迪, 黄川林. 大数据环境下面向突发公共事件的微博用户情绪分析[J]. 软件工程, 2017, 20(1).

[19] Baker M, Wurgler J. Investor Sentiment and the Cross-Section of Stock Returns[J]. The Journal of Finance, 2006, 61(4).

[20] 马若微, 张娜. 我国股票市场投资者情绪SENT指数的构建——基于上证A股公司的面板数据[J]. 中央财经大学学报, 2015, (7)

[21] 苏志, 张骐. 基于网络大数据的社会经济预测综述[J]. 情报杂志, 2015, (7).

[22] Choi H., Varian H. Predicting the present with google trend[J]. Economic Record, 2012, 88(s1).

[23] Da Z.,Joseph Engelberg and Pengjie Gao. In search of attention[J]. Journal of Finance, 2011, 66(5).

[24] Chauvet M, Gabriel S A, Lutz C. Mortgage Default Risk: New Evidence from Internet Search Queries[J]. Journal of Urban Economics, 2016, (96).

[25] Zheng S, Sun W, Kahn M E. Investor Confidence as a Determinant of China’s Urban Housing Market Dynamics[J]. Real Estate Economics, 2016, 44(4).

[26] 俞庆进, 张兵. 投资者有限关注与股票收益——以百度指数作为关注度的一项实证研究[J]. 金融研究, 2012, (8).

[27] 董倩, 孙娜娜, 李伟. 基于网络搜索数据的房地产价格预测[J]. 统计研究, 2014, 31(10).

[28] 孟雪井, 孟祥兰, 胡杨洋. 基于文本挖掘和百度指数的投资者情绪指数研究[J]. 宏观经济研究, 2016, (1).

[29] [德]托马斯·梅耶.传媒殖民政治[M]. 刘宁译.北京: 中国传媒大学出版社,2009.

[30] 游家兴, 吴静. 沉默的螺旋:媒体情绪与资产误定价[J]. 经济研究, 2012, (7).

[31] 宋逢明, 唐俊. 中国股票市场的信息传导与流动性需求[J]. 经济科学, 2002, (2).

[32] 饶育蕾, 彭叠峰, 成大超. 媒体注意力会引起股票的异常收益吗?——来自中国股票市场的经验证据[J]. 系统工程理论与实践, 2010, 30(2).

[33] Tetlock P C. Giving Content to Investor Sentiment: The Role of Media in the Stock Market[J]. Journal of Finance, 2007, 62(3).

[34] 石勇, 唐静, 郭琨. 社交媒体投资者关注、投资者情绪对中国股票市场的影响[J]. 中央财经大学学报, 2017, (7).

[35] Ruiz E. J.et al. Correlating financial time series with micro-blogging activity[Z]. International Conference on Web Search and Web Data Mining, 2012.

[36] Karabulut Y. Can Facebook Predict Stock Market Activity? [EB/OL]. AFA 2013 San Diego Meetings Paper. Available at SSRN, https://ssrn.com/abstract=2017099.

[37] 程琬芸, 林杰. 社交媒体的投资者涨跌情绪与证券市场指数[J]. 管理科学, 2013, (5).

[38] 黄润鹏, 左文明, 毕凌燕. 基于微博情绪信息的股票市场预测[J]. 管理工程学报, 2015, 29(1).

[39] 陈顾远等. 一种基于微博数据的公众环境污染情感指数估算方法[A]. 2016全国环境信息技术与应用交流大会暨中国环境科学学会环境信息化分会年会, 2016.

[40] 郭义超, 樊红. 基于中文文本分析的微博情感地图的制作[J]. 计算机系统应用, 2017, 26(2).

[41] 石磊. 地方政务微博服务公众满意度测评研究[D]. 湘潭:湘潭大学, 2016.

[42] Carlson J A, Parkin M. Inflation Expectations[J]. Econometrica, 1975, 42(166).

[43] Case K E, Shiller R J. Is There a Bubble in the Housing Market?[J]. Brookings Papers on Economic Activity, 2003, 68(2).

[44] 钟春平, 田敏. 预期、有偏性预期及其形成机制:宏观经济学的进展与争议[J]. 经济研究, 2015, (5).

[45] Mankiw N G, Reis R. Sticky Information versus Sticky Prices: A Proposal to Replace the New Keynesian Phillips Curve[J]. Quarterly Journal of Economics, 2002, (117).

[46] Evans G. Expectational Stability and the Multiple Equilibria Problem in Linear Rational Expectations Models[J]. Quarterly Journal of Economics, 1985, 100(4).

[47] Orphanides A, Williams J C. Imperfect Knowledge, Inflation Expectations, and Monetary Policy[Z]. National Bureau of Economic Research, Inc, 2004.

[48] Branch W A, Evans G W. A simple recursive forecasting model[J]. Economics Letters, 2006, 91(2).

[49] Milani F. Expectation Shocks and Learning as Drivers of the Business Cycle [J]. Economic Journal, 2011, 121(552).

[50] 刘涛雄, 徐晓飞. 互联网搜索行为能帮助我们预测宏观经济吗?[J]. 经济研究, 2015, (12).

[51] 俞立平. 大数据经济学的概念、框架与学科定位研究[J]. 统计与信息论坛, 2015, 177(6).

[52] 毛佳昕,刘奕群,张敏,马少平.基于用户行为的微博用户社会影响力分析[J].计算机学报,2014,37(04).

[53] 王亮.大数据时代对传媒经济研究的影响[J].青年记者,2014,(36).

[54] 俞立平. 大数据与大数据经济学[J]. 中国软科学, 2013, (7).

[55] 米子川, 姜天英. 大数据指数是否可以替代统计调查指数[J]. 统计研究, 2016, 33(11).

[56] 汪毅霖. 大数据预测与大数据时代的经济学预测[J]. 学术界, 2016, (11).

猜你喜欢
经济学情绪研究
移民与健康经济学
FMS与YBT相关性的实证研究
辽代千人邑研究述论
简明经济学
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
送餐的巫术经济学 精读
小情绪
小情绪
小情绪