人工智能炒股能跑赢大盘吗?

2020-12-16 07:55何诚颖
人民论坛·学术前沿 2020年16期
关键词:股票投资大数据人工智能

【摘要】人工智能的时代已经到来,通过量化分析、智能投资等方法,人工智能在股票投资中的作用越来越明显。然而,就目前的市场表现来看,人工智能炒股并不能跑赢大盘,其中美国的人工智能基金AIEQ跑不赢基准,选股能力不及基准指数,同时择时能力也并不显著;中国的人工智能基金发展较为落后,绩效优势也不明显。因此人工智能仍然只是作为辅助手段来帮助人类做股市投资。随着人工智能技术对金融行业的不断渗透,人工智能未来的发展将面对监管、法律和伦理等多重问题。

【关键词】人工智能  股票投资  大数据  量化投资

【中图分类号】F83                               【文献标识码】A

【DOI】10.16619/j.cnki.rmltxsqy.2020.16.008

人工智能的时代已经到来,有人把人工智能带给社会的变革称作是第四次工业革命,该技术在各个方面影响着人类的生活。人工智能对金融业的影响不容小觑,人工智能技术与金融学的碰撞产生了智能金融的概念,并引发了社会的广泛关注。人工智能在股票投资的相关领域已经有许多应用,并帮助人类解决了许多股票投资中的难题,提高了投资的效率、节约了投资的成本。与此同时,人工智能在股票投资中的应用也带来了许多问题,并改变着整个资本市场的投资生态。本文将从人工智能带给社会的变革开始研究,进而探析人工智能对股票投资带来的改变,洞悉人工智能在股票投资中的应用价值和未来发展潜力。

人工智能的发展

马文·明斯基被认为是人工智能之父,他在1956年将人工智能这一理念推向世人,他同时也是虚拟现实的最早倡导者。[1]人工智能可以被定义为能够让计算机系统模拟人类行为的技术手段,并在云计算和区块链等技术的共同协助下完成智能化任务。就最终目的而言,我们希望人工智能能够比肩人类智慧甚至超越人类智慧,不过目前人工智能离这一目标还有一定距离。

技术的进步和云计算能力的提升都推动着人工智能的发展。云计算的提升有助于提高图像、语音等复杂数据的处理能力,从而彻底改变传统的人机互动模式。此外,大数据的完善对人工智能的发展也功不可没,数据存储和数据质量的改善都推动了人工智能中机器学习的进步,在任务处理能力和反应速度上表现尤为明显。[2]在过去的30年中,智能化技术深刻改变了我们社会的运行规则和效率,可以概括为三次技术革命。第一次智能技术革命是硬件技术的进步,IBM和英特尔公司在这次革命中起到了主导作用;第二次技术革命是以软件的提升和发展为中心,微软以其Windows操作系统引领这场革命的发展;第三次技术革命则是以苹果公司的智能化手机iPhone为中心,开创了智能化便携式设备的发展道路;而今,我们正处于第四次技术革命的开端,这场技术革命便是由人工智能技术的进步带来,相关应用案例有人脸识别、自动驾驶、语音识别。

人工智能的发展水平主要分为三个阶段:服务智能、认知智能以及决策智能。服务智能主要是指人工智能代替人类做重復的劳动和繁重的任务,其主要采用有监督学习的方式进行,生物识别和智能客服都是这方面的应用实例。随着大数据规模的扩大和算力的提升,人工智能可从服务智能提高到认知智能。认知智能在对事物的判断中能够达到与人类基本相似的程度,其主要采取有监督学习的方式运行,这方面的应用实例有自动驾驶和智能投顾。2016年,李世石与AlphaGo的围棋之争获得广泛关注,AlphaGo的获胜是智能认知发展的阶段性成果。人工智能发展的最高级阶段为决策智能,其以无监督学习的方式运行,它可以预测人类无法想象或预知的事情。有许多人十分畏惧决策智能,因为他们担心如果让机器拥有决策智能,机器会控制甚至摧毁人类,但也有人认为只有让机器拥有决策智能才能在真正意义上实现人工智能。[3]

人工智能的早期意义是让机器模仿人的行为,其目的在于能够创造出与人类相似的机器。而近期新的思潮则认为人类思维仅仅是一种解决问题的思路,人类智能并不一定要模仿人类的思维,而应当联合不同的思维和模式来解决问题。机器学习是人工智能的核心,机器使用不同的算法来分析解码数据,从中找出规律为事后的预测和决定提供服务。根据学习的特点,机器学习可以大致分为三种:有监督学习、无监督学习以及深度学习。有监督学习是通过对有标签的数据样本进行分析研究,对数据的输出和输入进行观察从而找出其中的逻辑关系。无监督学习的数据样本是没有标记的,机器学习需要对大量的输出和输入的数据进行观测,在庞杂的数据结构中找出隐藏的内在逻辑关系。此外,更高层次的机器学习方法是深度学习,深度学习是通过多层神经网络进行学习,从而组合各层特征分析得出抽象的特征属性或内在逻辑。

如今,人们对人工智能一词已经耳熟能详,其已经成为各行各业争相发展的核心技术手段。人工智能的出现为各行各业带来了革命性的变化,正在显著改善着整个世界的运行规则。不同企业将人工智能技术与企业相关业务融合,这不仅大幅提升了企业的运营效率,也在很大程度上降低了企业的运营成本,多种新的业态和产业模式如雨后春笋般不断涌现。仅在2017年,全球人工智能产业就吸引超过150亿美元的投融资额,建立近1400家初创企业。

人工智能给全世界带来了新的机遇与挑战,各国政府和企业都认识到了人工智能的重要性,并在这一领域中展开了新的竞争。在人工智能发展的世界格局中,技术发展较早和较为成熟的是美国,美国拥有近700家人工智能初创企业,占到人工智能全球初创企业的近半成。在过去的8年中,以苹果、亚马逊、Facebook为代表的科技巨头累计收购近百家人工智能初创企业,并结合美国丰富的高校资源,大力发展人工智能技术。美国在人工智能领域发表的论文数量为全球最多,并拥有近90万人工智能研发人员。[4]

中国政府和企业也高度重视人工智能技术的发展。2016年,中国人工智能产业的投资总额仅占全球投资总额的约10%,而到了2017年,这一比例就大幅提升至50%。从国家的顶层设计来看,人工智能技术的发展从2016年起便得到了高度重视,国务院和相关部委都发文明确要求重视发展人工智能技术,为人工智能发展作了结构化的长远布局,并为相关行业提供有力的资金支持和法律保障。

人工智能在金融投资中的应用路径

人工智能影响着我们生活的方方面面,其中一个很重要的应用领域便是金融投资。金融机构和研究院纷纷涉足人工智能和金融投资的研究,并将两者结合从而产生了智能金融的概念。从理论层面来看,金融学和人工智能在探索问题上有很多共通之处。两门学科在探索问题中都在思考如何解决问题和做最终决策,在人工智能的研究中可以引入经济或者金融的理论,而在经济或者金融的研究中也可引入人工智能的理论。金融学的主要研究方法为计量经济学,计量经济学主要关注的问题为预测、总结和假设检验,并对预测结果的无偏性和一致性有一定的要求。人工智能的核心是机器学习,与计量经济学相比,机器学习更注重应用性,它更关注对未来预测的结果,而对决策流程的因果关系并不十分关注,所采取的主要研究模型包括决策树法(decision tree)、套索算法(Lasso algorithm)、岭回归法(ridge regression)、支持向量机法(support vector machine),等等。大数据的广泛发展拉近了计量经济学和人工智能两个学科之间的距离,缩小了两者间的差异。在大数据扩充和发展的条件下,机器学习才能真正发挥其价值。计量经济学面对的首要难题就是数据量的不足,在大数据存储和技术的发展下,先前制约计量经济学实证的小样本数据得以扩充,从而能够让机器学习对数据进行深度探究。传统的计量经济学模型在面对庞杂数据时往往束手无策,因为计量经济学无法有效找到关键的解释和控制变量。而机器学习在这方面的优势十分明显,机器学习能够自动对庞杂的数据进行降维,其中比较常见的机器学习算法有Lasso、Booting和随机森林等。人工智能可以弥补传统的计量经济学算法对投资者行为研究的不足,还可以为研究投资者行为提供新的思路。在人工智能中,机器学习可以将投资者心理、投资气氛等传统的计量经济学难以量化的指标纳入分析范围。[5]

简而言之,人工智能是金融投资分析的有效辅助手段。在金融分析中,人工智能技术与计量经济学等数理知识相融合,这解决了金融分析中面对大量数据无从下手的难题。应用人工智能技术,金融学分析可以更为有效地建立分析模型,探索和协助分析市场行情。与此同时,人工智能手段也在促进大数据的积累,人工智能可以迅速和准确地将文字、语音和图像等非结构化数据转变为可以存储和分析的结构化数据。

海内外各大金融机构都非常重视人工智能,并将智能化的金融产品和服务应用在股票投资中。目前与股票投资有关的人工智能服务主要有智能量化、智能投顾、智能数据服务、智能风控、智能研报等。[6]

人工智能在海外股市的应用探析

凭借人工智能的技术优势和资本市场的相对成熟,海外金融机构率先发展和利用人工智能在股票市场中进行相关投资。在全球范围内,顶尖的投行和金融机构使用人工智能技術投资的范围和领域不断扩大,投资收益和影响不断增强,这其中比较有代表性的国际金融机构有高盛、摩根大通。高盛与Kensho公司合作,大力发展人工智能行情系统,并通过该系统对投资市场和投资行为进行智能化控制。2008年,在高盛纽约的总部中,大约有3000名投资交易员,随着人工智能系统投入使用,现在交易员人数已经降至个位数。与高盛类似,摩根大通也极为重视人工智能在投资中的应用。摩根大通累计共聘用4万名人工智能开发人员来开发智能金融系统,累计投资总额超过90亿美元,约占总投资金额的1/3。与国外领先投行相比,国内金融机构在人工智能方面的发展略显不足,并缺乏自主研发能力。

人工智能在股票投资中的核心是智能量化投资:[7]量化投资的概念虽然在很早之前就已出现,但近些年的技术发展才使得量化投资真正实现智能化。量化投资依托于海量数据而生,海量数据的来源广泛,包括但不限于资本市场变化情况、上市公司调研报告、公司财务数据、金融市场政策文件、新闻资讯等。支持量化投资的主要技术有机器学习、自然语言处理和知识图谱(见表1)。量化投资的主要途径有两种,一种是对财务信息、交易数据进行分类汇总进而建立分析模型,利用传统的机器学习回归算法分析建立交易策略;另外一种是建立专家系统,模拟专家的投资决策行为,通过深度学习建立相应的投资决策方法。量化投资的基本流程分为四个部分,分别是策略识别、策略回测、执行系统和风险控制。其交易策略主要有量化选股、量化择时、期货套利、算法交易、期权套利等。此外,量化投资还采用事件驱动、行业轮动、多空策略和市场中性等手段。可见,量化投资具有纪律性、系统性、套利性、概率性等特征。

人工智能在A股市场的应用情况和问题

目前,智能量化投资已经大规模应用于国内各个金融机构,尤其在证券投资、期货投资、基金投资中的应用较为突出。在西方发达国家的资本市场中,量化交易已经占到了交易总量的近70%,而我国资本市场这一比例仅为30%,可见我国人工智能在这方面的应用还有很大发展空间。截至2018年底,我国公募基金采用量化投资的规模约为1100亿,私募基金的量化投资总规模约为2.3万亿。此外,国内出现了多家以人工智能为主要手段的量化投资服务公司,比较著名的有科大讯飞、智语良投、EAGO等,这些公司依据客户风险偏好推出了多种智能量化投资策略。

人工智能在A股投资中的应用解决了国内分析师无法解决的一些难题,也提高了投资的有效性。A股市场充满着各种各样的信息,资产价格的变动取决于对各种信息的反应,传统的金融分析依靠于分析师的判断,但分析师需要对海量信息进行搜集、筛选、分析,人工智能炒股可以很大程度上帮助分析师快速解决投资问题、迅速有效地做出投资决策。

人工智能很大程度上解决了A股投资中信息抓取和分析的难题。随着A股市场的发展变化和信息化速度提高,我们正在经历一个数据爆棚的年代。公司年报、公告、社会新闻、网络资料无时无刻不在更新,另外社交媒体如微博、微信和各种论坛里的消息也都对资本市场产生着影响。随着互联网和信息技术的发展,这些非结构化数据在未来还会呈指数级增长。分析师在面对海量数据时可谓捉襟见肘,尤其在短时间内分析大量数据可谓不可能完成的任务。即使拥有大量时间,分析师对数据的搜集和整理也将消耗大量人力和时间成本。人工智能在自然语言方面的技术突破很大程度上解决了人类分析师对信息获取、采掘和分析的难度。用自然语言技术将非结构化的数据转化为可以存储分析的结构化数据之后,机器学习算法会将处理后的数据加以分析判断从而做出投资决策。分析师能够取得的信息和数据是有限的,更多是集中于所熟知的领域或范围内,而人工智能的数据挖掘则可以扩展范围和广度,从而更加深入全面地了解行业和市场的状况。[8]

人工智能可以用复杂的机器学习、知识图谱等技术手段较为快速和准确地判断和预测市場行情,这在很大程度上减少了A股分析员在投资中的误判和迷茫。先进的机器学习算法和知识图谱等技术可以对海量数据加以分析,从政策面、基本面、技术面等多维度提升分析准确率。人工智能的发展使得股票预测从之前的单一模型和单一维度向多模型和多维度发展,模型的复杂程度也显著提升。此外,由于机器能够24小时不间断运作,人工智能通过模型对风险的预测和监控会更加及时有效。资本市场往往会遭遇“黑天鹅”事件的冲击,在短时间内就会造成系统性的危机,智能量化系统可以自动执行操作指令做出及时响应,从而能够有效避免投资损失。[9]

目前,我国人工智能技术发展还不完善,因此在投资决策中仍然会出现一些错误。人工智能的基础是大数据,然而人工智能系统在搜集、筛选和整理数据的过程中就可能出现疏漏,进而导致数据的偏差。数据的偏差最终会导致结果的偏差,这使得预测和判断无效。人工智能在做决断时需要多个步骤的协同,然而,衔接好每个步骤并保证完全无误是一项艰巨的任务,现有的技术手段无法完全保证人工智能在无人监控的条件下能够独自连接所有任务。金融分析研究和金融投资决策是两项相对独立的任务,人工智能在金融分析中的典型应用是智能投顾,在金融投资决策的典型应用是智能化交易。人工智能在两项任务中都表现得十分出色,但是目前技术水平无法保证人工智能可以毫无差错地链接两项技术。人工智能的一些程序化算法和机器学习是人类无法理解的,所以人类无法实时监控人工智能,保证其不犯错。在一些极端案例中,人工智能一旦犯错带来的损失会十分惊人,此前法国兴业银行一名员工就因程序化交易不当给公司造成了30多亿欧元的损失。[10]

如果市场大范围采用人工智能进行投资,此前人工智能的制胜策略届时可能也会失效。人工智能炒股能够跑赢大盘的关键点在于拥有超越一般人类的智能化技术和量化模型,但是当所有市场参与者都改用人工智能做股票投资的时候,这种人工智能超越人类的制胜优势也就随即消失了。投资方如果希望再次获得市场中的超额收益就必须不断改进和完善掌握的人工智能技术,但是技术的发展是有瓶颈的,即使拥有大量资金也未必能够在短时间内研发出大幅优于竞争者的人工智能技术。[11]

人工智能在A股投资中遇到的另一项难题是法律制度和政府监管的问题。人工智能技术发展很快,监管机构的人员需要与时俱进跟上技术发展,从而能够理解人工智能在投资中的应用并制定相应法规体系。人工智能技术在投资中还可能与道德伦理、隐私保护等原则产生一定程度的冲突。人工智能在决策中到底是要考虑整个金融体系的健康发展,还是只考虑个别投资方的利益最大化,取得的收益应当尽量惠及整个社会还是只利于少数投资人,这都是需要思考的道德伦理问题。此外,人工智能的分析要以大数据为基础,数据的丰富可能会与公司信息保护和个人隐私等原则相冲突,监管机构如何平衡这两者也是一项难题。虽然我们看到现行的法律和原则鼓励信息披露,但是我们也不应忽视一些公司由于信息披露和核心情报泄露所导致的损失。[12]

人工智能在股市投资中的绩效评估

全球首支以人工智能为手段的ETF基金已于2017年底在纽交所上市,它的全名是AI Powered Equity ETF (代码:AIEQ)。依托大数据的支撑,AIEQ主要采用IBM公司提供的人工智能技术手段来分析判断美股投资机遇。AIEQ是一支全天候运作的基金,无时无刻不在追踪市场变化,利用量化手段分析数以万计的信息包括公司年报、新闻、论坛等,从而,在6000余支美国股票中找寻投资机会。AIEQ通过自我学习能够不断完善量化交易策略和算法分析手段。

AIEQ刚刚出现时,很多投资经理和分析员都十分担心自己的工作受到威胁,惧怕AIEQ的市场表现会超过人类管理的基金。然而,一年多过去了,AIEQ并未如预期般表现出色,利用彭博终端提供的数据,表2给出了其与基准指数标普500总回报指数在不同时间区间的涨跌幅,从整个时间样本区间来看,AIEQ的累计涨幅为13.47%,不及基准指数17.09%的涨幅,特别是在美股大幅下跌的第2个子区间,AIEQ的跌幅明显超过基准指数,不过在美股上涨的第1和第3个子区间里,AIEQ的涨幅都略胜基准指数。

为了进一步衡量AIEQ相对于基准指数来说是否具有选股和择时能力,我们采用计量模型Rpt-rft=α+β(rmt-rft)+γ(rmt-rft)Dt+εt来评估,其中Rpt、rft和rmt分别为第t日AIEQ、短期国债和基准指数在第t日的收益率,Dt为虚拟变量,当rmt>rft 时为1,否则为0。在该模型中,AIEQ的选股能力和择时能力分别由α和γ来衡量。表3给出了模型的估计结果,其中α和γ的t统计量用来检验其估计值是否显著大于0,即AIEQ的选股能力和择时能力是否明显;而β的t统计量检验的是其估计值是否大于1,即AIEQ的风险是否显著高于市场基准。

表3中结果显示,AIEQ没有选股能力,全样本下风险调整后的年化收益为-7.58%,在第2和第3个子区间内的风险调整后的年化收益更低,分别为-38.77%和-10.44%,同时对应的t统计量显示,AIEQ在这2个区间内的选股能力明显不及基准。AIEQ的择时能力也不明显,全样本下择时能力γ的估计值虽然为正,但对于的t统计量并没有达到一般的显著性水平,AIEQ仅在第3个子区间表现出一定的择时能力。另外,全样本下市场风险β的t统计量显示,AIEQ的市场风险明显高于基准。

AIEQ虽然没有跑赢大盘,但整体表现不算太差。在近2000只美国ETF投资基金中,AIEQ的排名大约在200~300的区间中,排名相对位居前列。若与个股比较的话,AIEQ的上涨幅度高于同期2/3的美股。

国内首支利用人工智能炒股的股票型公募基金浙商智能行业优选混合A于近日获批,由于该基金近期还在进行备案和筹备等相关工作,后续市场表现仍有待观察。不过国内公募基金中有部分采用人工智能机器算法作为辅助分析手段的大数据基金已经运行数年。利用Wind提供的数据,表4给出了大数据基金的相关信息及收益表现,其中超额收益为基金复权净值涨跌幅与基准指数收益率之差,我们统计的是各个基金自赎回日之后至2018年8月27日的年化日均超额收益,并给出了t统计量来检验基金收益率是否显著高于基准指数收益率。表中t统计量的绝对值大都在2以内,表明大数据基金收益率与基准指数收益率的差异并不明显,仅南方大数据300A的收益明显高于基准。

表5进一步给出了对大数据基金自赎回日之后至2018年8月27日区间的选股与择时能力的评估。博时淘金大数据100A、南方大数据300A、博时银智大数据100A、天弘云端生活优选这4只基金选股能力α的t统计量大于2,表明他们的选股能力显著优于基准,风险调整后的年化收益率分别为25.4%、6.49%、11.3%、22.5%。其他大数据基金的选股能力与基准相当,并没有任何一支基金的选股能力明显不及基准。

而在择时能力方面,则没有任何一支基金具有明显的择时能力,甚至还有4只基金的择时能力显著为负,分别是博时淘金大数据100A、博时银智大数据100A、天弘云端生活优选、泰达宏利同顺大数据A。其中前3只基金是有显著的选股能力的,但由于他们的择时能力显著为负,导致基金收益与基准指数相差不大。

人工智能炒股能跑赢大盘吗?这是一个值得深思又极富争议的问题。有人乐观地认为在不久的将来人工智能可以取代人类做股票投资,并且可以持续跑赢大盘获得正向收益。不过就目前的技术手段和现实情境来看,人工智能完全取代人类做投资决策并持续跑赢大盘还是不大可能。

即使未来技术发展成熟,人类或许也不会完全放权给人工智能做投资决策。作为万物之灵的人类总有着能够掌控万物的欲望,人类更愿意接受人工智能作为辅助投资的工具而不是用它完全替代人类做投资。人类一方面希望随着技术的成熟人工智能能够最终取代人类做股票投资并持续跑赢大盘;另一方面又在畏惧这一变化给整个资本市场甚至世界带来的影响。未来是难以预测的,但可以肯定的是人工智能应用于股票投资的潮流不会改变,我们唯一能够做的就是去拥抱这一变革,顺应这一历史潮流。

(本文系国家自然科学基金项目“资金流、交易者异质性与股市波动”的阶段性研究成果,项目编号:71373225)

注释

[1]埃森哲、百度金融:《与AI共进,智胜未来:智能金融联合会报告》,2018年,第36~37页。

[2]罗兰贝格研究院:《2019年关于人工智能的十大议题》,2019年,第4~5页。

[3]李振、周东岱、王勇:《“人工智能+”视域下的教育知识图谱:内涵、技术框架与应用研究》,《远程教育杂志》,2019年第4期。

[4]王哲:《AI100榜单折射人工智能发展新态势》,《中国工业和信息化》,2019年第7期。

[5]陈永伟:《人工智能与经济学:近期文献的一个综述》,《东北财经大学学报》,2018年第3期,第6~7页。

[6]何诚颖:《智能金融变革》,北京:中国财经出版社,2018年。

[7]张英健、王昕宇、樊晓芳:《机器学习算法已成量化投資跑赢市场的新推手》,《智周报告核心版》,2019年7月29日。

[8]李文哲:《人工智能正在改变证券行业》,《中国战略新兴产业》,2019年第19期,第45~49页。

[9]胡蝶:《人工智能在金融领域的应用研究》,《金融纵横》,2018年第9期,第47~48页。

[10]杨东:《监管科技:金融科技的监管挑战与维度建构》,《中国社会科学》,2018年第5期,第69~90页。

[11]Matteo B. et al., "Artificial Intelligence in the Real World", The Economist, 2016, pp. 10-12.

[12]https://ai100.stanford.edu/.

责 编/周于琬

猜你喜欢
股票投资大数据人工智能
人工智能与就业