曾辉 程善钿
在全球经济的快速发展进程中,由于忽视生态系统治理和环境保护,地球的生态系统变得日益脆弱,气候危机和生态多样性问题不断加剧。2018年的诺贝尔经济学奖颁给了保罗·罗默和威廉·诺德豪斯,表彰其在技术创新推动内生增长和气候变化纳入宏观经济分析方面的贡献,两位大师的理论在探寻这个时代最根本的问题——如何创造长期可持续的经济增长。
而这正是我们研究的切入口,通过人工智能(AI)和大数据的应用来研究如何更有效地推动可持续金融与投资,以实现经济增长与可持续发展之间的平衡。气候变化与经济金融本就密不可分,其中ESG(环境、社会和公司治理)投资扮演的角色日益重要,宏观层面引导着资本流向可持续发展领域,微观层面及时反映企业可持续发展的能力和潜力。近年来,随着人们对气候变化和可持续发展议题的高度关注,人工智能驱动的ESG投资将逐步成为全球性共识,并有助于加速落实联合国可持续发展目标(SDGs)。
ESG投资成为落地可持续金融的主战场
随着可持续发展成为全球性重大议题,ESG理念和实践在全球范围内快速发展。在国际层面上,ESG从方向性的导则到信息披露的标准,再到压力测试和ESG评级等具体的技术方法,由国际机构和监管机构搭台、投资机构响应的格局已经形成。
与此同时,ESG投资在中国也风生水起,正成为落地可持续金融的主战场。随着中国可持续发展金融实践的推进,在国际可持续金融标准的基础上,发展中国特色的数据驱动的可持续金融评估分析体系,将成为中国大国担当和落实生态文明的有力抓手。我们认为,在全球现行的ESG标准基础上,纳入气候变化、自然资源、环境治理、产品责任、社会贡献、公司治理等方面的指标,也是体现我国积极推进资源环境承载能力評估、应对气候变化、关注高品质生产、提升上市公司质量等行动的有效方式。
然而,目前ESG投资面临着全球性的数据缺陷,同时也是数据价值洼地,严重制约了ESG投资的落地与推进。可以说,传统的CSR/ESG报告的数据难以支撑系统的ESG评级、为ESG投资形成扎实的数据基础。通过研究和实践发现,现有的ESG数据有以下痛点:
1.数量庞大的非结构性数据:ESG分析目前由大量的传统文本和图表格式的非结构化数据组成,而市场公开数据和传统行业的研究报告缺乏准确性和及时性,大部分ESG数据仍依靠企业自愿披露,这为后续的定量分析和追踪增加了难度。
2.数据滞后:多数ESG评级的数据来源依赖于披露的财报或CSR报告,而财报和CSR报告多为半年度或年度更新,导致许多ESG指标每年只更新一次,因此难以通过分析这些指标形成反映管理风险或提升回报的最具时效性的信号。
3.数据不够全面:大部分ESG数据覆盖周期大约5年,数据范围、回溯时间等难以做到全面覆盖,数据类型单一导致可替代性差。
4.缺乏客观准确性:许多数据如制造业生产状况、企业治理评分等来源于线下人员调研报告或专家主观评分,不同的数据供应商或评级机构对ESG指标所赋予的权重有所不同,导致缺乏客观准确性。
而这些ESG数据的痛点,恰恰是人工智能(AI)技术及以卫星遥感影像、舆情信息、定位数据等为代表的多源另类数据能发挥作用的地方。
人工智能驱动ESG投资的实现路径
如何基于人工智能在资产管理和投资研究等方面的经验,与ESG投资相结合,仍是学界和业界共同需要解决的难题。实际上,从ESG数据获取、数据驱动的ESG评级到ESG投资策略,AI技术都将发挥不可或缺的作用。
首先,挡在ESG评级上的第一道难关就是数据的获取和分析,因此针对最底层的数据生产环节,通过多源异构数据的整合分析、自然语言处理(NLP)和大规模金融知识图谱能解决“卡脖子”的数据难题(如上图)。一方面,丰富的数据基础能支持后续大规模的运算,另一方面可以深度挖掘数据背后的关联关系,建立风险传导机制。具体的应用场景如下:
一是卫星遥感对于E(环境)相关指标的监测。AI中的计算机视觉(Computer Vision,CV)技术结合高光谱卫星、雷达卫星等卫星影像可以用来分析制造业生产单元的环境表现和企业对周边环境的影响,如废气排放、废水排放、土地使用情况、围堰等情况。分析成果可用来交叉检验企业的排放报告数据,识别“洗绿”行为。同时,CV结合移动端的街景图片可用来分析当地的空气质量,使区域居民可以参与企业的环境监测,既是企业环境表现的受众,又是有效监督者。
二是可以利用舆情和图谱分析对于S(社会)和G(公司治理)中供应链及公司治理结构等相关指标进行监测。企业的财务表现会影响股东权益,而企业的ESG表现则会影响更广泛的群体,监管公告和舆情报道可成为企业ESG表现的客观反映。这类数据来源广泛,但目前人工获取和分析效率较低,AI中的自然语言处理(NLP)技术可以自动识别事件主体,对监管处罚的类型和严重程度进行归类,分析舆情关联事件和影响程度,还可以通过事理图谱分析,跟踪事件的演进。
三是ESG风险会通过企业关联关系传导,包括供应链、股权链和产业链,例如上游水源企业发生环境问题,会影响到下游饮料行业的生产活动。AI中的知识图谱(KG)可以基于各种关联关系和企业属性建立庞大的图数据库,并根据图谱挖掘算法、识别出企业间未披露的联系,并分析ESG传导的路径和程度,使ESG分析师能站在更全局的角度去分析ESG风险的扩散情况。
四是针对ESG指标的量化值,AI可以被用作未披露企业缺省值的填充。传统的数据填充方法会参考同行业披露企业的数据,利用同行业企业的相似性,填充缺省值。但当前企业业务线广泛,简单的行业分类并不能很好地反映其相似性。AI的聚类算法可以实现更准确的相似性分析,使得缺省值填充基于最相似的企业特性,从而确保填充值更接近真实值。
其次,基于数据基础和技术能力,可以综合形成数据驱动的ESG评级体系。这套体系是基于监管文件、国际标准、数据基础和负面清单所构建的准实时更新的ESG评级体系(如图),能对公司做出更加客观、全面的评估。
最终,基于AI技术可实现三大ESG投资策略。一是ESG评级:填补传统ESG评级基于财报或CSR报告而分析数据不足的问题,提供准实时的公司ESG评级,筛选或剔除ESG投资标的;二是ESG指数:帮助投资机构筛选和跟踪投资组合的ESG风险,提供全方位基于ESG评级的投资组合分析支持;三是ESG因子分析:基于机器学习的特征工程技术、强化学习和人工参与特征的生成,进行ESG因子的提取、挖掘,通过数据库—因子构建—因子回测—因子评价—因子跟踪的流程构建因子策略,整合ESG因子,归因可持续的超额收益。
曾辉:微众银行人工智能部高级研究员;程善钿:微众银行人工智能部高级产品专家