ChatGPT情感感知策略识别下的贸易新闻及其人民币汇率短期波动效应研究

2023-11-01 09:10汪勃澄

金融经济学研究 2023年5期

郭维韩迪汪勃澄

一、文献综述与问题提出

汇率波动影响一国国际收支平衡、金融安全与稳定，也是货币政策选择与实施所必须考虑的关键因素，其决定机制和影响因素一直是学术界和各国货币当局关注的焦点。在开放经济条件下，汇率波动受到复杂的国际、国内，政治、经济等因素的影响，然而在长期和短期中，其决定机制和影响因素存在差异。汇率的中长期趋势主要受到一国经济的基本面和核心宏观经济变量的影响；而汇率的短期波动的背后则有更复杂多元化的政治经济诱因，例如货币政策改变（Yosuke Kido，2016）、政治事件发生、国际关系转向（Guo et al．，2021）等。近年来，学术界开始关注不同事件对人民币短期波动的影响，笔者认为原因主要有两方面，其一，关于汇率在长期中的决定机制，相关研究已经形成较为成熟的理论体系，例如购买力平价学说、利率平价学说、国际收支说、资产市场说等汇率决定理论，从不同视角研究了汇率长期波动的决定因素，而对于短期波动的诱因，却尚未形成完整的研究架构；其二，随着人民币国际化和市场化推进，人民币汇率的市场化程度和波动弹性逐步提高，使其短期波动幅度扩大，且对外部事件的敏感度大大提升。

而新闻事件作为短期事件的典型别类，成为研究人民币汇率短期波动的重要工具。汇率的资产属性使其投资者易受非理性预期影响，对汇率具有潜在影响的事件通过新闻影响外汇市场参与者的市场预期，从而影响他们的投资决策，进而引起人民币汇率的短期波动，构成了各类事件影响人民币汇率短期波动的自实现过程和传导机制。二十世纪七十年代末，Mussa（1979）基于传统汇率决定理论，结合理性预期假说，首次提出“新闻模型”。Frenkel（1981）对预期事件和未预期事件做了明确界定，分析得出影响汇率的关键因素是“新闻”，引起了学术界的广泛关注。朱孟楠和闫帅（2018）通过构建经济不确定性指数，研究中美经济新闻对在岸和离岸人民币汇率的影响，结论表明人民币汇率主要受与中国货币因素有关的经济新闻变量的影响。丁剑平和刘璐（2020）研究中国货币政策不确定性和宏观经济新闻的人民币汇率波动效应，认为中国的宏观经济新闻是影响人民币汇率的关键变量。孙少龙等（2022）构建了外汇新闻情感挖掘的汇率预测方法，发现外汇新闻情感极性和美元兑人民币汇率之间存在格兰杰因果关系和长期的协整关系。

关于中美贸易新闻对人民币汇率短期波动的影响。2018年3月23日，中美贸易战正式开始。人民币汇率在国内外压力下大幅波动，学术界开始从多个角度探讨中美贸易战对人民币短期波动的影响。例如，从中美贸易差额、中国对美国的直接投资和投资者避险情绪分析中美贸易战对人民币汇率的传导渠道（鄂志寰，2018）；从中国对美出口量持续高位运行、在商品上产生通缩效应分析中美贸易战背景下人民币贬值原因（厉启晗，2019）；评估中美贸易战事件与人民币汇率之间的关系，探究不同类型事件对汇率波动的影响（Guo＆Chen，2023）。此类文献主要从国际贸易框架、大国政治经济博弈分析等理论视角分析中美贸易战对人民币汇率的影响。

在研究方法上，现有文献主要用计量经济学方法和人工智能技术分别研究新闻事件对汇率的影响。在计量方法中，一部分运用事件研究法定义新闻的事件期和估计期，并根据成功事件标准将事件分为“反转”、“平滑”和“放大”，以评估事件对汇率的影响是否存在、影响程度大小（刘涛和周继忠，2011；郭维，2018）；另一部分文献通过构建政治压力指数（Liu＆Pauwels，2012）、经济新闻指数（朱孟楠和闫帅，2018）测度新闻事件对人民币汇率收益率的影响；此类研究中运用了RS－EGARCH－M（Ho et al．，2017）、ARMA和GARCH（Guo et al．，2021）等计量模型。随着人工智能技术在经济学领域的广泛应用，自然语言处理（NLP）技术被广泛用来研究财经新闻、财经评论、社交媒体等非结构化文本数据的情感极性。新闻情感分析主要有两大类方法，基于情感词典的新闻情感分析方法（孙少龙等，2022；任仙玲和邓磊，2019；Huang et al．，2022；Semiromi et al．，2020）和基于机器学习算法的新闻情感分析方法（张杰等，2021）。在此类研究中，计量经济学方法的劣势是对于事件的分类、估计和情感标识，仅限于人工手段，不能达到智能化技术的准确性和高效性；而人工智能技术的不足则在于对新闻事件的处理不够细化，擅长大样本数据在预测中的应用但未关注到不同类型事件对汇率短期波动的差异性，且当涉及到文本预处理、情感词典构建等复杂工作时，难以实现完全智能化。同时，以上两种情感分析方法的准确性还依赖于词库的增量更新（韩迪等，2019），即如新闻出现词典未收录（更新）的词汇，会导致情感分析的模型性能受到影响。

本文首次利用在目前大语言类模型（large language model，LLM）中性能先进且稳定的GPT－3．5－turbo模型（截止2023年6月，OpenAI公司使用的ChatGPT正式发布版依然是GPT－3．5－turbo版本，本文中涉及ChatGPT以及GPT技术均指GPT－3．5－turbo模型），探索相关贸易新闻对人民币汇率短期波动的影响。和以往处理外汇新闻情感不同的是，本文将ChatGPT技术运用到人民币汇率波动的研究中，ChatGPT除了能够实现大量准确的自动化处理（新闻爬取、事件分类以及情感识别）等工作外，关键替代了过去研究中对新闻事件的文本预处理（如中文分词、词库构建、词典维护）等操作。即在确保准度的情况下，工作量却有着天壤之别。

同时，由于ChatGPT创造性地在其云语料库中用标注好的人工偏好作为奖励信号，促使训练模型越来越符合自然语言的认知理解模式，经过知识输入和在使用中持续调整策略，ChatGPT更靠近自然的语言表达方式。因此在本文研究贸易新闻的情感感知的问题上，ChatGPT表现出了比自然人或者主流算法更强的知识储备以及上下文理解的特点。

具体来说，本文首先利用ChatGPT与BeautifulSoup爬虫模型结合，收集2017年1月至2019年12月期间中美贸易相关新闻事件；其次运用ChatGPT引导式Prompt策略并结合事件研究法，实现对事件来源和类型进行准确分类，按照事件来源分为“中国”、“美国”与“中美”事件，按照事件类型分为“政策类”、“会议类”事件；再次利用训练后的ChatGPT模型，根据新闻事件对人民币汇率短期波动可能产生的影响，为各类事件赋予“正面”或“负面”标签；最后将ChatGPT赋予事件的标签作为特征值输入带有时序的人工智能模型LSTM，验证不同类型的贸易新闻事件对人民币汇率短期波动影响的显著性。

本文的边际贡献主要体现在以下几点：第一，将ChatGPT技术与事件研究法相结合，运用到人民币汇率波动的研究中，与过去研究中对新闻事件的文本预处理相比，实现了对新闻事件的自动化的批量处理（爬取、分类、感知等）。更重要的是该方法替代了过去研究工作中对情感数据库的维护工作，无需事先建立数据库或进行额外的数据处理。第二，通过在ChatGPT中构建引导式Prompt策略，实现了对贸易新闻情感极性的自动判断。该策略通过引入行业领域上下文，旨在修正LLM的学习感知偏差问题。优化后的ChatGPT模型，对贸易新闻的情感极性分析较未经调整的ChatGPT准确度大大提高，且可以通过追加Prompt策略适应新的情境和领域。第三，将主流的机器学习方法（LSTM模型）与ChatGPT赋予的情感标签相结合进行，验证正面与负面、会谈类与政策类、来自中国、美国与中美双方的贸易新闻对人民币汇率短期波动影响的显著性。

二、理论分析与假说提出

2017年1月，特朗普就任美国总统后开始逆全球化地奉行保护主义及单边主义，并多次启动针对中国的贸易调查，使两国经贸关系持续陷入紧张局势。2018年3月，特朗普宣布对美国进口的所有钢铁和铝分别征收25%和10%的关税，中美贸易战正式开始。此后，中美贸易战逐渐升级，两国互相加征关税、启动贸易调查和对相关企业进行贸易制裁的事件频发。2018年12月，中美双方达成协议暂停中美贸易战，中美贸易关系有所缓和，在2019年两国均放宽关税加征政策，并在2020年1月签署了第一阶段经贸协议。但从同年3月开始，美国又开始对中国商品加征关税并对中国企业采取限制措施，中美贸易战在两国间政治经济领域多维度博弈中持续加剧。与此同时，伴随着中美贸易战的跌宕起伏，中美双边汇率波动幅度持续扩大。人民币对美元汇率在2017年累计升值近6%，2018年3月中美贸易战开始至12月累计贬值近10%，8月突破了“7”元大关，2019年全年波动率接近4．44%。

中美贸易战的演化过程为研究新闻事件对人民币汇率短期波动的影响提供了生动素材。中美贸易新闻是否会对人民币汇率短期波动构成影响，将会构成多大程度的影响，与两方面因素有关，一是人民币汇率的市场化程度，该因素决定了人民币汇率短期波动是否可能受到外部事件影响，是贸易新闻向人民币汇率波动传导的必要条件；二是中美贸易新闻事件对人民币汇率的传导机制，该因素决定了贸易新闻事件是否具备向人民币汇率波动传导的有效机制和路径。

（一）贸易新闻事件对人民币汇率波动的传导条件：人民币汇率的市场化程度

通过汇率制度改革，人民币汇率基本实现了市场化目标，人民币汇率完成了从记账核算工具到宏观经济调节工具的转变，正在实现从宏观经济金融管理自变量到因变量的转变（丁志杰，2018）。人民币的市场化程度在贸易新闻事件对人民币汇率波动的传导中有着重要意义，是其影响效应发挥的必要条件。自2005年7月汇率制度改革以来，中国开始实行以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度，人民币市场化和国际化进程也正式开启。2010年6月央行提出“进一步推进人民币汇率形成机制改革，增强人民币汇率弹性”；同年，香港离岸人民币市场正式形成并得到快速发展；2015年“811”汇改调整中间价形成机制，充分体现市场供求对汇率形成的决定性作用；2016年2月，人民币兑美元汇率中间价形成机制更加明确，提高了汇率机制的规则性、透明度和市场化水平，人民币成为与美元、欧元、英镑和日元并列的第五种SDR篮子货币；2020年以来，人民币对美元汇率年化波动率为4．5%，与国际主要货币基本相当，其弹性强度基本实现了市场化目标。汇率市场化水平的提高会产生“信号效应”（宋科等，2022），当人民币汇率具有充分的弹性时，其受到外部事件影响的可能性也相应增大。人民币汇率的市场化程度加强了贸易新闻对其短期波动产生影响的可能性。

（二）贸易新闻事件对人民币汇率波动的传导机制：非理性预期与外汇市场微观结构

汇率“新闻模型”提出，未预期到的新闻事件是引起汇率波动的重要因素。而新闻事件向汇率传导的机制与非理性预期和外汇市场微观结构有着密切联系。首先是非理性预期。汇率的资产属性使其投资者易受非理性预期影响。非理性预期打破了有效市场假说关于汇率能够完全体现宏观基本面并反映所有市场信息的设定。受信息不对称和有限关注等因素影响，投资者在构建投资决策时，无法对全部信息进行关注，只能根据自己的学识、能力、经验等，选择关注部分信息，形成非理性的、异质性的投资决定。根据选择性注意理论，受众对外界信息具有主动选择能力，投资者为了追求自身利益，主动选择与自身需求相关性强的信息。从搜索成本理论角度来看，投资者在某项资产组合所投入的内部和外部的搜索成本，追求该项资产信息中所包含的有价值的部分，并结合自身的认知和收集到的信息进行分析，最终做出相关的投资决策。其次，外汇市场微观结构变化。外汇市场微观结构主要基于市场参与者的行为和市场特征来研究（姜波克，2001）。在非理性预期的影响下，新闻事件通过向市场参与者进行信息传递，改变投资者预期从而引起外汇市场微观结构变化。具体地，外汇市场投资者对贸易新闻的认知会通过交易行为反馈到外汇市场中，引起市场微观主体行为和市场预期的变化，并由市场参与者对某种方向的交易行为达成一致，最终导致汇率短期波动。对外汇市场投资者来说，人民币作为金融资产的一种，投资者为其分配关注度后，接受信息形成判断，买入或者卖出人民币资产，引起人民币汇率的变动（Peltomäki，2018；谷宇和郭苏莹，2020）。在中美贸易摩擦阶段，相关贸易新闻通常会引起投资者的高度关注，进而从两个方面对短期汇率波动产生影响。一方面，投资者关注并解读贸易新闻事件后会改变自己对于市场预期，进而调整自身的投资组合从而引起汇率的短期波动；另一方面，外汇投资者对于不同类型的事件会形成乐观关注或悲观关注的投资者情绪，进而会通过采取不同方向的调整手段影响汇率。譬如，当正面事件发生时，投资者会将其视为利好信息，预判人民币汇率对美元升值；当负面事件发生时，投资者会将其视为利空消息，预判人民币汇率对美元贬值。如果上述逻辑成立，那么正面和负面贸易新闻将会引起人民币汇率非同方向的波动，并实现预期的自我强化。

根据以上两点，本文提出两个假说。

假说1：贸易新闻事件会引起人民币汇率短期波动。

假说2：在贸易新闻中，正面事件、负面事件，会谈类事件、政策类事件，来自中国、美国、中美双方的事件分别显著引起汇率在不同程度上的短期波动。

三、基于ChatGPT的引导式情感感知策略

人工智能技术历经了信息技术和数字技术发展的高级阶段，随着现阶段信息数据的海量底蕴和高速增长态势，使得人工智能的算法优化和场景适配精度提升成为可能（邓云峰和张年华，2023）。但人工智能技术的发展，一直存在智能能力突出而情感能力不足的问题。不足主要体现在不具备价值判断能力以及不稳定精准情感计算输出等方面，即在算法和算力均不充分的情况下，模拟情感感知的工作显得不够精准。而LLM模型通过对自然语言思维方式和表达习惯的技术性模仿，逐渐具备可以识别一些接近现实生活的“特殊场景”的情感感知。但这种感知，依然不是“真的理解”。

目前，在线实时更新的NLP模型已越来越多地应用于金融行业的自动化处理任务中，如文本分类、情感分析和自然语言生成。随着transformer（Vaswani et al．，2017）架构的提出，NLP正式进入大语言类模型（large languagemodel，LLM）时代，GPT发展历程见图1。

图1 自然语言处理模型的发展历程

ChatGPT是当下最先进的LLM模型，而已有的情感判断（感知）模型工作繁琐效率较低且技术门槛较高不宜推广，因此本文尝试将其应用于金融领域的情感感知中①ChatGPT具有上下文理解能力，不仅仅可以做出情感判断，并在整体语境中进行情感感知，识别出更准确的情感倾向。，在确保准度的情况下，进一步提高处理效率和降低操作难度。具体来说本文用到以下关键技术和架构：首先，本文选取ChatGPT而非其他模型，是因为其基于自注意力机制（Self－Attention）的深度神经网络（Transformer）的基本架构，该模型适合舆情分析与判断（Alejandro and Tang，2023），和过往模型相比，在提供贸易新闻时能够更准确地判断情感感知结果。其次，在爬取的贸易数据方面，本文对数据的分类整理上使用了基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）技术，该技术结合奖励模型对文本生成模型的结果进行自动评估，并采用强化学习对文本生成模型进行优化，使其最终生成符合本文预期的文本。上述环节是ChatGPT内容生成能力提升的关键。然后针对行业使用了指示调谐（Instruction Tuning）技术，基于指令描述，可以促使模型理解指令任务，从而生成预期文本。例如，用户输入“判断这句话的正负面情绪：中美迎来首次全面经济对话”，其中“判断这句话的对错”是指令描述，指令任务是对“中美迎来首次全面经济对话”进行情感判断，从而生成预期的答案文本“该句话正面”。最后结合思维链（Chain of Thought）技术，通过一系列前后关联的指令，可以辅助ChatGPT完成复杂的推理任务。本文输入的每条贸易新闻并不是孤立的数据个体，特别是前文判断的经验也可以影响后面输入的结果，而思维链技术可以有针对性地设计模型的指令输入，促使模型将整体推理任务拆解为包含多个链式步骤的任务。

虽然ChatGPT技术运用在贸易新闻的情感感知中相较于其他NLP模型性能表现优异，但在具体实施过程还存在以下问题：由于模型的训练数据来源于互联网上的文本，这些数据可能会存在一定偏差，例如文本的主题、来源和质量等，这可能会影响ChatGPT模型的性能。在本文研究数据中将中美贸易新闻数据输入未经调整的ChatGPT进行情感极性判断与分类统计，发现整体准确度欠佳，未达到人工分类的准度，且输出结果难以调用。通过统计人工分类与ChatGPT的输出异常结果进行研究发现具体问题如下：

未经调整的ChatGPT无法准确理解任务含义、无法分类统计边界事件、输出内容非格式化、面对复杂分类问题时表现不稳定。针对上述问题，本研究基于强化学习方法（RLHF）实现循环迭代ChatGPT的分类统计策略。该策略的核心是在ChatGPT模型中进行指示调谐，即增加行业领域的引导式Prompt策略，从而实现ChatGPT对上下文情感的准确感知，提升ChatGPT在外汇领域的表现。以下述策略构建的分类统计算法如表1所示：

表1 基于ChatGPT的引导式prompt策略伪代码

第一，初始化提示，赋予ChatGPT角色属性。设置分隔符使ChatGPT准确理解任务并避免提示注入问题。

第二，检查边界事件特性，设置边界事件的处理方式。给出限制条件（如生成文本的长度、格式或特定的词语使用），可以影响模型生成的结果。

第三，设定行业领域的回答实例，要求ChatGPT根据实例输出内容并格式化输出以备后续调用。该操作指导模型以对问题进行回答的方式生成响应，可以帮助模型更好地理解问题的意图，并生成相关的回答。

第四，细化复杂的分类统计步骤，将分类统计任务拆分为数个子任务，令ChatGPT按照设定的步骤基于RLHF方法思考并完成任务。

四、研究设计

为了高效且准确地验证上述假说，本文首次将ChatGPT技术应用运用于金融领域的数据收集与数据挖掘中。首先，利用ChatGPT结合爬虫算法代替以往人工操作以及单一爬虫技术，收集2017年1月至2019年12月期间中美贸易相关新闻事件；然后，结合事件研究法，运用ChatGPT对事件来源和类型进行分类，按照事件来源分为“中国”、“美国”与“中美”事件，按照事件类型分为“政策类”、“会议类”事件；最后，通过对ChatGPT增加行业领域的“引导式”策略训练，使得ChatGPT模型能够根据新闻事件对人民币汇率短期波动可能产生的影响，为各类事件赋予“正面”或“负面”标签。

在此基础上，将ChatGPT感知结果与LSTM时序模型结合，即将ChatGPT赋予事件的标签作为特征值输入时序模型LSTM，验证两个假说。

（一）数据来源和样本区间

1．数据来源。（1）汇率数据。本文使用的人民币汇率数据为美元兑人民币汇率（USD／CNY即期汇率），从wind数据库获取。（2）事件数据。本文通过Python的OpenAI库和BeautifulSoup库共同实现ChatGPT的爬虫模型，准确高效且自动化地收集中美贸易新闻事件，包括来自中美官方公开发布的政策类事件和会谈类事件。政策类事件包括两国出台的中美贸易相关政策或报告；会谈类事件包括两国之间的会晤／交涉／经济对话／磋商／访问／通话／沟通／联合声明等。事件数据来源基于美国贸易代表办公室网站、中国财政部官网、中国商务部官网、CCTV网站、新华网、央视网、环球网、百度等渠道爬取，并调用OpenAI库下的prompt参数进行精确筛选。

2．样本区间。本文样本区间为2017年1月1日至2019年12月31日。尽管中美贸易战从2018年3月正式开启，但本文考虑到自特朗普2017年1月上台以来提出对中国展开贸易调查，中美贸易摩擦事件增加，使得中美经贸关系开始变得不稳定，同时人民币汇率也从2017年初开始出现较大幅度波动，因此将2017年1月1日作为样本期的起点。同时，为剔除疫情影响带来的干扰，将2019年12月31日作为样本终点。

（二）基于ChatGPT与事件研究法的人民币汇率短期波动研究

本文基于事件研究法研究思路，使用ChatGPT对中美贸易新闻进行分类统计（表1中4～13行），以此研究中美经贸关系对人民币汇率的影响，具体研究思路如下：

1．定义事件。本文将事件定义为中美官方层面正式的、公开的经贸事件，包括来源于中方、美方和中美双方的贸易事件，事件类型进一步分为政策类和会谈类。政策类事件包括美国对中国发起贸易调查、美国或中国对另一国加征关税或减税、美国或中国对另一国企业增加贸易限制或减少贸易限制等事件；会谈类事件包括中美元首会晤、中美两国高级别贸易磋商、中美对话、签署贸易协议等。在2017年1月1日至2019年12月31日期间，收集到中美贸易新闻事件共116件。

2．定义事件窗口。该做法的目的是分析事件发生前后人民币汇率的变化，因此事件窗口的长短成为研究特定事件对人民币汇率的影响的关键因素。事件窗口过短可能会由于事件影响的时滞性而忽略部分事件的影响，过长则容易出现事件叠加现象，从而难以区分开不同的独立新闻事件对汇率波动的影响。参考郭维（2017）对事件窗口的定义，使用事件前后2个交易日作为事件窗口长度，用来评估事件前后汇率的变化情况。

（三）基于ChatGPT与LSTM模型的人民币汇率短期波动研究

贸易新闻的发生是一个动态变化过程，投资者依据不同时点、不同类型、不同来源、不同色彩的新闻事件调整其投资行为，进而对人民币汇率产生影响。上述传导过程往往呈现为复杂的非线性关系。LSTM模型部署到了真实金融场景中，由于其相对于其他时间序列模型的优势而受到时间序列分类界的广泛关注。在分类精度方面，LSTM都优于几种传统的时间序列分类模型，同时对数据的预处理要求最少。此外，LSTM可以很容易地利用大量的时间序列数据进行扩展，即调整贸易新闻数据量模型无需特别更改。

因此，本研究使用能够挖掘使用变量之间的深层次关系并调用大量潜在有价值的非线性序列数据的LSTM模型进行短期汇率预测，同时将ChatGPT分类统计的中美贸易摩擦事件的标签作为特征值输入LSTM模型（以2017年2月3日的数据为例，LSTM模型输入数据的特征信息见表2）。为了提高模型拟合能力，进而提高汇率预测的稳定性，本文使用Adam优化器进行训练，采用tune框架对模型进行超参数调优，最终LSTM模型的超参数如表3所示。

表2 特征信息表

表3 LSTM模型超参数设定

五、实证结果分析

（一）事件期分类统计结果

本文对样本期间116个事件，实现ChatGPT循环迭代分类统计策略后结果如图2所示。116个事件中，包括正面事件52个，负面事件64个，政策类事件90个，会谈类事件26个，中国来源事件25个，美国来源事件65个，中美双方来源事件26个。

图2 分类统计结果

同时根据事件窗口定义，本文需要对样本期间116个事件进行合并整理，具体做法包括以下三点。

1．合并发生时间重合的新闻事件。新闻事件通常包括单日事件与持续数日的连续事件，如发起调查、加征关税等通常为单日事件，中美对话（会议或洽谈等）通常为连续事件，两类事件都可能发生时间上的重复，从而影响对同时期汇率波动估计的准确性。对此，本文的处理方法是，将这些事件进行合并，使之成为一个复合事件，而对于正面／负面影响的判断，则以其中最关键的事件对中美经贸关系的影响为准。例如“美国公布拟对中国加征关税的商品清单”和“中国决定对美进口价值500亿美元的103项商品加征关税”两个单日事件均发生在2018年4月4日，本文首先将两个事件分别命名为“美对中加征关税”和“中对美加征关税”，再将两个事件合并为一个事件期，影响为“负面”。

2．合并发生在节假日内的多个新闻事件。节假日内发生的事件，其发生时间虽然没有重合，但是在评估时均是通过节假日前后的汇率数据来反映汇率的变化程度，评估单个事件与多个事件的效果一致，因此将节假日内发生的事件合并为一个事件期。如2017年1月27日到2月2日是一段春节假期，假期里发生了“美国将对从中国进口的大型洗衣机征收高额反倾销税”与“美国商务部就对华不锈钢板带材反倾销和反补贴调查作出终裁”两个不同单日的事件，则将两个事件合并为一个事件期。

3．合并细分类型的事件。本文进一步将正面新闻分为中美对话、中加大对美采购、美对中企业暂停限制、美对中放宽关税政策、中对美放宽关税政策五类；负面新闻分为美发起调查、美将中列为汇率操纵国、美指责中、美对中企业增加限制、美对中加征关税、中对美加征关税六类。

合并后得到事件期共110个，统计结果如表4所示。

表4 事件子类型统计表

（二）LSTM模型实证结果

1．评价指标。本文采用在机器学习领域中针对回归问题常用的评价指标，具体包括平均绝对百分比误差（Mean Absolute Percentage Error，MAPE）、平均绝对误差（Mean Absolute Error，MAE）和百分比误差绝对值的标准差（Standard Deviation of Absolute Percentage Error，SDAPE）三个评价指标，对模型的预测精确度与稳定性进行评价，进而验证不同类型的新闻事件影响人民币汇率波动的显著性。其中，MAPE、MAE的值越小代表模型预测精度越高，SDAPE的值越小代表模型预测稳定性越高。公式如下：

其中，n代表样本总量，yt代表实际值代表预测值，t代表数据序列编号。

2．实证结果分析。为了验证不同类型的新闻事件影响人民币汇率波动的显著性，本文分别将人民币汇率数据（USDCNY）、人民币汇率数据结合贸易新闻事件（USDCNY＿trade）、人民币汇率数据结合负面事件（USDCNY＿neg）、人民币汇率数据结合正面事件（USDCNY＿pos）、人民币汇率数据结合政策类事件（USDCNY＿policy）、人民币汇率数据结合会谈类事件（USDCNY＿talk）、人民币汇率数据结合中国来源事件（USDCNY＿CN）、人民币汇率数据结合美国来源事件（USDCNY＿US）、人民币汇率数据结合中美双方来源事件（USDCNY＿CN－US）等作为特征值输入LSTM模型，以精确性与稳定性指标间接判断不同新闻事件影响人民币汇率波动的显著性。

对于假说1而言，对比USDCNY与USDCNY＿trade的结果（表5）可知，将贸易新闻事件加入原有汇率预测模型（即第二行USDCNY＿trade）的汇率预测误差要优于仅使用汇率数据（即第一行USDCNY）的模型，三个指标分别从15．851%降低到13．785%、1．109%降低到0．962%与15．692%降低到13．648%，预测误差减小，意味着加入贸易新闻事件作为离散变量标记汇率数据后，模型预测能力得到有效提高，即贸易新闻事件确定会引起人民币汇率短期波动。

表5 基于贸易事件发生与否的LSTM汇率预测结果

对于假说2来讲，对比USDCNY、USDCNY＿neg与USDCNY＿pos的结果（表6）可知，负面事件USDCNY＿neg与正面事件USDCNY＿pos的精确性与稳定性也同时均优于USDCNY模型，即对事件细分进一步提高模型的表现能力。值得一提的是，将负面事件USDCNY＿neg和汇率数据作为特征值输入模型，其预测精确性与稳定性评价指标（13．022%、0．910%与12．893%）均优于使用正面事件USDCNY＿pos和汇率数据输入模型（13．861%、0．969%与13．723%），即相较于使用正面事件标记汇率数据，使用负面事件进行标记可以更准确得捕捉到人民币汇率的短期波动，且负面事件比正面事件提升更明显，在所有输入的数据中模型表现次优。

表6 基于事件影响的LSTM汇率预测结果

对比USDCNY＿policy与USDCNY＿talk的结果（表7）可知，政策类事件USDCNY＿policy的MAPE、MAE和SDAPE值（12．956%、0．905%与12．827%）显著低于会谈类事件USDCNY＿talk（14．829%、1．037%与14．681%），证明政策类事件对汇率波动的影响较会谈类事件更为显著。

表7 基于事件类型的LSTM汇率预测结果

对比人民币汇率数据结合中国来源USDCNY＿CN、美国来源USDCNY＿US与中美双方来源USDCNY＿CN＿US的结果（表8）可知，使用美国来源事件标记汇率数据能有效提高模型的汇率预测能力，其MAPE、MAE和SDAPE值分别为（13．430%、0．938%与13．296%），使用中国来源事件（15．241%、1．066%与15．090%）与中美双方来源事件（14．846%、1．039%与14．698%）作为特征输入模型，对模型的预测能力影响不大。

表8 基于事件来源的LSTM汇率预测结果

综上所述，本文的两个假说都是成立的。对于假说1，加入任何贸易新闻数据（除第一行外所有数据）都比没有加入新闻数据（第一行USDCNY）时预测性能更好。对于假说2，在假说1的基础上，把贸易新闻不同特征标签加入模型后，对影响汇率波动的显著性影响由高到底排序为：USDCNY＿policy政策类事件、USDCNY＿neg负面事件、USDCNY＿US美国来源事件、USDCNY＿pos正面事件、USDCNY＿talk会谈类事件、USDCNY＿CN＿US中美双方来源事件、USDCNY＿CN中国来源事件。换言之，在汇率预测中加入政策类事件USDCNY＿policy的预测性能表现最优，负面事件USDCNY＿neg次之，正面事件、会谈类事件、中美双方来源事件与中国来源事件对汇率波动的影响并不显著。

六、结论

本文将ChatGPT技术应用在贸易新闻事件对人民币汇率短期波动影响的研究中。通过ChatGPT技术和爬虫技术、事件研究法和LSTM模型的结合，实现了贸易新闻事件的爬取、分类以及情感感知，并通过将ChatGPT赋予事件的标签作为特征值输入时序人工智能模型LSTM中，验证了本文提出的两项研究假说，并进一步得到了以下结论。

第一，训练后的ChatGPT技术应用在贸易新闻的情感感知中，与以往的人工处理或者通过新闻关键语句触发数据库提取情感判断的方法相比有以下优势：一是自动化处理。ChatGPT可以快速处理大量的贸易新闻文章。相比人工处理，它可以在更短的时间内分析和处理大量文本数据。二是上下文理解能力。ChatGPT可以理解上下文，并在整体语境中进行情感感知。它不仅仅依赖于关键语句，还可以综合考虑文章的整体内容，识别出更准确的情感倾向。三是强大的语言处理能力。ChatGPT是一个经过大规模训练的语言模型，具有强大的语义理解和推理能力。它可以识别和理解贸易新闻中的复杂语言结构和隐含信息，从而比自然人或者主流语言处理模型更准确地判断情感。四是无需数据库提取。传统方法中，需要通过中文分词提取关键语句并与数据库进行匹配，以判断情感，技术难度和工作量都比较大，而ChatGPT可以直接对整个文本进行情感感知，无需事先建立数据库或进行额外的数据处理。五是适应新的情境。ChatGPT可以通过追加训练的方式适应新的情境和领域。一旦有了新的贸易新闻数据，可以使用这些数据对ChatGPT进行进一步的训练，从而提高并扩展其在贸易新闻情感感知方面的准确性。此外，ChatGPT结合引导式Prompt技术不止应用在贸易新闻的情感感知中，还可以应用于其他金融领域的研究中。

第二，贸易新闻事件会引起人民币汇率短期波动。随着近年来人民币汇率制度改革进程加速与人民币国际化的逐步推进，人民币汇率的市场化水平有所提升，使人民币汇率的短期波动弹性增大，使之更易受到短期外部事件尤其是在中美贸易摩擦背景下的贸易新闻事件影响。此外，关于新闻事件对人民币汇率的潜在传导机制，投资者关注、非理性预期假说、“新闻模型”等理论已经提供了一系列解释，人民币离岸市场和在岸市场的互动性增强、贸易渠道和投资渠道的传导能力在资本项目逐步开放的背景下进一步扩大，这些因素都强化了贸易新闻事件对人民币汇率短期波动的影响效应。

第三，在贸易新闻事件中，负面新闻对人民币汇率短期波动的影响较正面新闻而言更为显著。由此可见，负面新闻大部分为导致中美贸易摩擦加剧的负面效应极强的事件。相较而言，正面新闻中占比最大的中美会谈事件则更偏向中性色彩，为中美贸易关系带来可能的转机但也存在一定的不确定性。因此，负面新闻对人民币汇率波动的影响较正面新闻更强烈的研究结论，符合事件特征和理论预期。

第四，在贸易新闻事件中，政策类事件对人民币汇率短期波动的影响效应大大高于会谈类事件；由美国引起的事件对人民币汇率短期波动的影响效应大大高于中美双方来源事件与中国来源事件。政策类事件对汇率短期波动影响更显著的结论表明外汇市场投资者更容易受到与实际政策相关的贸易新闻影响，从而改变汇率预期，而对会谈类的贸易新闻则相对不敏感，一个可能的解释是后者通常在发生前已有市场预判且每个事件持续时间较长，因此对汇率短期波动的影响相对不显著。