多源数据驱动的上市公司风险识别路径分析

2023-01-09 01:02谭明亮吴昶欣
中小企业管理与科技 2022年11期
关键词:财务指标年报结构化

谭明亮,吴昶欣

(川北医学院,四川 南充 637100)

1 引言

根据《中华人民共和国公司法》(2018年修正),上市公司(Listed Company)是指股票在证券交易所上市交易的股份有限公司。由于上市公司通过证券市场向社会公众发行股票来筹集资金,其财产来自于全社会,其投资者由成千上万的社会公众所构成,同时受到广泛的社会监督,因此上市公司在国际上也被称为公众公司(Public Company)。在中国,股份有限公司申请其股票上市必须在注册资金、股本总额、财务状况和公司治理等多个方面满足严格的要求;在美国,纽约证券交易所(NYSE)、纳斯达克证券交易所(NASDAQ)等对于申请股票上市的公司也有着各自的要求,具体包括市值、净资产、税前收入、公众持股数和股东人数等多个方面。

上市公司风险识别是证券投资分析、资产风险管理、证券市场监管等金融管理决策过程中的重要内容,同时对于防范化解系统性金融风险和保障金融安全有着重要的意义。习近平总书记和李克强总理等党和国家领导人多次在重要的会议和场合上强调防控金融风险对于打赢防范化解重大风险攻坚战的极端重要性以及金融安全在国家安全中的重要战略地位,指出要及时有效地识别、发现、处置和化解系统性金融风险。本文从基于结构化数据的上市公司风险识别和引入非结构化文本数据的上市公司风险识别两个方面对研究文献进行综述,以期为上市公司风险识别研究提供借鉴参考。

2 上市公司风险的概念

风险这一概念最初主要被用来描述自然风险,如今这一概念已经被广泛应用于政治、军事、经济、文化和社会等领域中。尽管风险这一概念在各种场合和情境下被广泛使用,但是学术界对于风险的概念还没有一个统一的定义。美国学者Haynes 于1895年在其著作《Risk as an Economic Factor》中最早对风险这一概念进行了定义,他指出风险意味着发生损害或损失的可能性。另外,可以从一些政府部门和相关组织机构发布的文件中获取风险的定义。世界上第一个国家风险管理标准《澳大利亚-新西兰风险管理标准》(AS/NZS4360:2004)将风险定义为事项发生的可能性和对目标的影响。巴塞尔委员会(BCBS)于2004年颁布的《巴塞尔新资本协议》(Basel II)将风险定义为由于可能的损失而导致预期收益的不确定性。美国反虚假财务报告委员会下属的发起人委员会(COSO)于2004年颁布的《企业风险管理——整合框架》将风险定义为对目标产生负面影响的事项。国际标准化组织(ISO)于2009年颁布的风险管理标准《ISO/FDIS31000 风险管理—原则和指引》将风险定义为不确定性对目标的影响。2009年颁布的中国国家标准《风险管理术语》(GB/T 23694—2009)将风险定义为某一事件发生的概率和其后果的组合。2013年修订颁布的中国国家标准《风险管理术语》(GB/T 23694—2013)则将风险定义为不确定性对目标的影响。

综合国内外的专家学者、政府部门和相关组织机构对风险的相关定义,本文将上市公司风险定义为:上市公司在生产经营的过程中,由于各种不确定因素和发生不利事件,从而有遭受损失的可能性。作为一个特殊的企业群体,上市公司除了面临着一般企业所面临的破产风险、信用风险、财务风险、政策风险、运营风险、管理风险、市场风险、人力资源风险、技术风险和战略风险等共性风险以外,还面临着强制退市风险、信息披露违规风险和股价暴跌风险等上市公司所特有的风险。与此同时,不同行业、不同规模、不同商业模式、不同业务性质、不同发展阶段、不同股权结构、不同财务状况和不同经营管理水平的上市公司所面临的风险也不尽相同。

3 基于结构化数据的上市公司风险识别

当前用于上市公司风险识别的数据源主要是根据上市公司的资产负债表、利润表和现金流量表计算所得的财务指标数据,研究者们主要关注于各类财务指标的选取。美国芝加哥大学的教授Beaver[1]研究发现上市公司的财务指标数据中包含了破产预测所需要的有价值的信息,其中净收入/总负债这一项财务指标的预测能力最高。纽约大学著名的财务专家Altman[2]通过对美国破产的上市公司的财务报表数据进行研究,对22 个财务比率进行数理统计筛选,最终共保留了5 个常用的财务指标作为破产预测因子,构建了用于破产预测的5 变量Z-Score 模型。该模型通过对上市公司的5 个财务指标数据进行一定的加权求和,得到上市公司的Z 分数,上市公司发生破产的可能性与模型计算所得的Z 分数成反比关系,即Z 分数越小则意味着上市公司破产的可能性越大。在美国、英国、法国和日本等多个国家,Z-Score 模型得到了广泛的应用。

Altman 等[3]后续又在破产公司样本数据的收集和分析的基础上对Z-Score 模型进行了优化和扩展,建立了包含7个财务指标的Zeta 模型。相较于Z-Score 模型,Zeta 模型具有更全的财务比率覆盖面、更大的适用范围以及更高的预测准确率。如今Zeta 模型已经被美国、意大利等国的商业银行广泛地应用于上市公司的破产预测、财务危机预测和信用评级等场景中,创造了巨大的经济效益,但是Zeta 模型中的7 个变量的权重系数由于涉及商业秘密,因此并未公开。

自Beaver 和Altman 的研究之后,国内外的研究者们将财务指标数据广泛地应用于上市公司的破产预测、财务危机预测、信用风险预测等场景中。Kim 等[4]选取了涵盖企业债务清偿、资本结构、盈利能力、营运能力、财务杠杆、流动性和公司规模等7 个方面的30 个财务指标用于韩国上市公司的破产预测。Zi ba 等[5]选取了64 个财务指标应用于波兰的制造业公司的破产预测中。Zhang 等[6]选取了反映企业抗风险能力、运营效率、盈利能力和增长能力4 个方面的20 个财务指标来识别上市公司的信用风险。Du Jardin[7]选取了反映企业流动能力、周转能力、盈利能力、营运能力、偿付能力和财务结构6 个方面的30 个财务指标应用于法国上市公司的破产预测。

黄志敏[8]指出上市公司的财务危机预测模型需要考虑到上市公司的行业特征,而不是使用同一个预测模型来对所有行业的上市公司的财务危机进行预测,并在详细分析旅游类上市公司的行业特征的基础上,构建了涵盖偿债能力、盈利能力、运营能力、发展能力、资本结构和投资收益6 个方面的旅游上市公司财务危机预测指标体系。李雪[9]从盈利能力、成长能力、营运能力、偿债能力4 个方面选取了12 个财务指标来衡量创业板上市公司的退市风险。方匡南等[10]在已有的相关研究文献的基础上,选取了反映企业的偿债能力、盈利能力、营运能力、成长能力、资产结构和每股指标6 个方面的48个指标来实现上市公司的信用风险预测。

4 引入非结构化文本数据的上市公司风险识别

上市公司的财务指标数据由于具有容易获取、便于计算以及分析结果易于决策者理解等优点,被广泛应用于上市公司风险识别的学术研究和应用实践中。然而财务指标数据也有着诸多的缺陷:首先,财务指标数据只能反映上市公司在过去的经营业绩,而不能反映上市公司的经营计划、外部竞争环境、未来发展战略以及潜在风险等其他多个方面的重要信息。其次,披露上市公司财务指标数据的年报、半年报、季报等文件的更新频率较低,因此财务指标数据很难及时地反映上市公司出现的风险。除此之外,财务指标数据表示的上市公司资产账面价值可能与资产真正的价值存在差异,且存在被操纵的风险。最后,财务指标数据往往是建立在上市公司可持续经营的基础上,并且在给定的监管框架内以相同的方式进行计算,即使具有同一财务指标数据的上市公司所面临的内外部风险以及未来的收益往往并不相同。

金融领域存在的多源异构数据中的绝大部分是非结构化的文本数据,如上市公司的年报文本、招股说明书文本、半年报文本、临时公告文本、公司研报文本、新闻报道文本和股吧评论等。以上市公司披露的年报文件为例,据前人的研究和统计结果表明,定量财务信息仅占上市公司年报中所有信息的20%左右,而其余80%左右的信息则以定性文本的形式存在。近年来,国内外的研究者们在开展金融数据分析与挖掘相关的研究时发现,与只关注过去经营业绩的结构化的财务数据不同,上市公司的年报文本、新闻报道文本等非结构化文本数据不仅反映了上市公司在过去的经营成果和当前的财务状况,还包含了公司发展前景、未来战略规划和所面临的内外部风险等多个方面的重要补充信息。非结构化文本数据不仅具有结构化的财务数据所难以体现的丰富价值和内涵,而且还能够有助于提高对定量会计信息的理解。也有少部分研究者探究了视频和音频等多媒体数据在金融决策支持中的应用,例如,Hobson 等[11]利用一种可以根据人的语音来感知情绪变动以实现谎言的辨别和欺诈的识别的音频情感分析软件系统LVA 来分析上市公司CEO 在业绩电话会议(Earnings Conference Calls)上的讲话语音,并在此基础上实现上市公司财务错报的检测。随着互联网的广泛普及和以证监会为代表的政府监管机构对上市公司信息披露的要求日趋严格,上市公司的年报文本、招股说明书文本、季报文本、临时公告文本、新闻报道文本和股吧评论等非结构化文本信息有着较高的可获得性。

国内外的研究者们在将各种非结构化的金融文本数据应用于上市公司风险识别的研究上进行了积极的尝试。Mayew 等[12]研究发现,在上市公司破产的前3年时,MD&A披露的文本信息在预测破产方面比财务指标信息更加有用。Gupta 等[13]对全球金融危机期间破产倒闭的52 家美国上市银行年报文本信息进行了分析,发现年报中表达的积极情感比消极情感具有更强的预测能力。Wang 等[14]将上市公司年报文本中的情感特征和文本特征提取为非财务特征,并与传统财务特征进一步融合,提高了上市公司财务危机预测的准确率。Wei 等[15]基于840 家美国能源上市公司的3 707 份10-K年报中披露的风险因素文本信息,确定了能源企业的66 种风险因素。

马旭辉[16]将上市公司年报文本数据应用于上市公司的财务风险预测中,发现能够提高风险预测的效能。李秉成等[17]发现上市公司年报MD&A 中的前瞻性信息对于上市公司的财务危机预测能力有着显著的提升作用。苗霞[18]研究发现上市公司年报MD&A 中前瞻性文本信息所具有的净积极情感值能够在上市公司的财务危机预测发挥有效的作用,并且上市公司的网络新闻报道能够进一步提升MD&A 中前瞻性文本中的情感信息在财务危机预测方面的价值和有用性。

5 结语

目前用于上市公司风险智能识别的数据源主要是上市公司的财务指标数据、公司治理数据、证券交易数据和宏观经济数据等结构化的数据。而非结构化的金融文本数据资源中包含了大量有关上市公司的过去经营成果、当前财务状况、未来发展前景以及所面临的内外部风险等多个方面的重要信息。非结构化的金融文本数据不仅具有财务指标数据、证券交易数据等结构化的数据难以体现的丰富价值和内涵,而且还能够有助于提高对定量财务数据的理解。从国内外的相关研究发展现状来看,越来越多的研究者开始关注于将上市公司的年报文本、新闻报道文本和股吧评论等非结构化文本数据应用于股票价格预测、公司业绩预测等任务中。少部分的研究者尝试将文本数据资源应用于上市公司风险智能识别研究中,但总体而言,这些研究还处于起步阶段,将多种类型的非结构化文本数据应用于上市公司风险智能识别的研究仍然缺乏。

猜你喜欢
财务指标年报结构化
我刊2021年影响因子年报
我刊2021年影响因子年报
我刊2021年影响因子年报
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
关于财务指标实际应用的思考
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
探讨医院财务分析中财务指标体系的应用
EVA业绩评价体系应用分析