康靖雯 史晓霖 王甜
(中国矿业大学(北京)管理学院 北京市 100083)
随着电子商务的快速发展,商务智能中自动谈判的智能化、灵活化已成为大势所趋。Agent 自动谈判作为人工智能领域的重要代表,具有自主性、灵活性、拟人化等特点,使谈判智能化,大幅降低谈判成本,同时解决了谈判的时间、空间上的约束,提高谈判效率。在后疫情时代的大背景下,全球电商行业快速发展,Agent 所拥有的天然优势满足了电商发展的智能化需求,成为促进双方交易的重要帮助。
情感是人的重要特征之一[1],它除了对人的内部造成影响外, 还会对人的外部活动产生影响,即对相关事物的内在评价和受到感观刺激后的外在反应。有学者将情感体验划分为两个维度[2],即激励和唤起维度。Damasio 认为,人的情感可划分为初级情感和二级情感,初级情感是接受环境刺激后、深入思考之前所产生的情感,二级情感是进一步逻辑推理所产生的。
舆论是公众关于现实社会以及社会中的各种现象、问题所表达的信念、态度、意见和情绪表现的总和,是一定范围内持同种观点的Agent 形成一定规模后出现的,舆论中的用词也包含着发出方Agent 对于舆论客体的情感和评价。奥尔波特指出,舆论是人类个体的行动的表现,是多数人的表达,它受到目标与情景的刺激和引导。严石将舆论定义为社会生活中却踢的一致性意见,它是一种社会的思想,具有支配人们行为的权威性和约束力。舆论具有丰富性、一致性、强烈程度和持续性三个特性,在其传播过程中也混杂着理性和非理性的部分。客观来看舆论本身会对Agent 谈判造成内部和外部的双重影响,这种影响又会一定程度上影响Agent 双方的谈判决策。
综上,对Agent 情感和舆论方面的研究都较为成熟,积累了大量的研究成果。在Agent 情感研究方面,宿云[3]研究了智能Agent 本体模型并基于OCC 模型,它是对事件、对象、Agent 等综合而成的结果,他提出了一种多智能体诱发逻辑模型,根据电脑信号测量用户情感;彭程[4]建立了一种多智能体情感驱动的强化学习方法,通过多智能体间的情感交流使得群体决策一致,在舆论的分析方面,伍京华[3]将舆论分为积极和消极两类,运用形式逻辑理论,尽力基于Agent 的劝说中的积极舆论模型的评价体系,实现将Agent的劝说与舆论相结合。
本文从舆论的情感倾向评价入手,利用算法计算舆论的情感值,进而判别舆论的情感倾向。其次,综合考量Agent的情感态度和交易双方的性格及舆论的情感倾向,结合性格因素利用OCC 模型对情感进行量化,而后针对不同情况,分别制定恰当的劝说策略,从而大幅提高谈判效率,降低双方的谈判成本。
舆论是Agent 设置情感劝说目标和确立情感劝说决策的重要因素,对舆论进行评价有利于确保其准确性。首先,需要对舆论文本进行预处理,确保文本规范化和标准化;其次,对处理后的与论文本进行情感分析,确立舆论的情感倾向;再次,依据Agent 的感知价值确定其是否有合作意愿;最后,若Agent 有合作意愿,则依据舆论情感分析倾向和Agent 自身情感分别确定交易目标和做出劝说行为。
舆论信息千变万化,从网络直接爬取到的文本信息往往面临着词语、格式等不规范的问题,因此,我们需要依据具体情况,对原始舆论信息的文本进行预处理。
1.1.1 原始文本提取与优化
在针对事件选取舆论时,我们需要利用计算机技术进行网络爬取文本,可以使用TF-IDF[5]对舆论进行关键字提取,了解舆论的大致情况。根据情况选择合适的文本信息。
(1)TF 指的是词语在有关事件评论中的词频,为了便于不同文本长度的评论中词语的词频相互对比,所以需要将TF 规范化,经过规范化后TF 的值为:
其中,m 为词语在评论文本中出现的次数,M 为评论中词语的总数。
(2)逆文档频率IDF 表的是特定词语的重要性,如果在语料库的文档中,出现该词语的文档数越少,那么我们认为该词语越能代表该文档的特征,IDF 的计算公式如下:
其中,c 为语料库文档总数,C 为出现该词语的文档数
(3)综合词语的词频(TF)和逆文档频率(IDF)可以计算出该词语的TF-IDF 值[10,11],TF-IDF 值可以看作对一篇文档中的关键字评价值,将TF-IDF 值高的词语集合在一起,就可以得出对一篇文章的大致概括。
我们从互联网直接爬取到的原始文本质量及数据内容往往参差不齐,需要将原始爬取的文本进行初始的文本优化,将一些带有特殊符号,语序错乱的文本删除掉,可以帮助提高后续分析的准确性。
1.1.2 情感词典增删
情感分析,也称作情感倾向性分析,是对分析文本中所携带的情感进行推理、分析、归纳的过程。情感分析可分为基于情感词典和基于机器学习两种方法。本文使用基于情感词典法。即是将情感词典与各种算法相结合,通过判断特定的积极和消极情感关键字是否出现在分析文本中从而确定其情感值。简单来说,若正面情感词汇数量大于负面情感词汇数量,那么评论会被判定为正向情感;若正面情感词汇数量等于负面情感词汇数量,那么评论会被判定为中立情感;若正面情感词汇数量大于负面情感词汇数量,那么评论会被判定为负向情感。本文使用的褒贬义词典结合 SO-PMI 算法是基于情感词典的情感分析。
在对舆论进行分词处理时,由于不同网络舆论具有其独特的特点,会出现许多新的表达方法,汉字语言艺术的博大精深及很多修辞手法的情感处理,导致文本情感的判断及量化过程较为困难,传统的简单分词处理判断的准确率不高。为了能更好地针对文本进行分词处理,更加准确的情感分析,需要在分词所依据的基本词典的基础上针对文本的特殊性及时效性,添加一些新的特有词汇。例如网络热词、专用词汇等。
1.1.3 评论加权算法
在丰富情感词典后,我们要进行文本的筛选。在选择舆论时,因不同事件的社会影响力、影响范围、辐射广度、影响深度都不同,故而需要根据不同事件的重点、影响力、质量等因素,在整个事件舆论整理的过程中对内容进行加权选取,而后对分析效果较差的文本进行筛选,选出后进行文本整体删改与修正,使其更符合舆论实际情感,提高模型的普适度。
情感分析是判断舆论情感倾向的重要步骤,利用情感分析可以得出每条经预处理之后的舆论的情感是积极还是消极。本步骤包括情感词典的选取和情感值计算两部分。
1.2.1 情感词典的选取和制作
情感词典包括基础情感词典和专属情感词典两部分。
在基础情感词典的选择方面,目前比较成熟的情感词典有知网的Hownet 情感词典、NTUSD 台湾大学情感词典、大连理工中文情感词汇本体等,其词库大体相同。
专属情感词典需要我们根据爬取到的舆论用词和情感表达来进行添加。为了保持专属情感词典与基础情感词典的一致性,专属情感词典的情感极性和情感强度可尽量根据基础情感词典中相近或相反的词汇来进行标注,对于一些网络新词,可自行判断情感极性和强度。在利用jieba 进行分词后,统计出现频次较多的名词(不包含停用词)作为舆论对象。将舆论对象对应的词语与情感词典匹配,为其标注情感强度和极性。
1.2.2 情感值的计算
在基础情感词典和专用情感词典的基础上,分别计算情感词与褒义词语和贬义词语之间的PMI 值来衡量两个词语之间的相关性。
其中,wi是舆情评论中的每一个情感词,negj为情感词典中带有消极情感的贬义词,posj为情感词典中的带有积极情感的褒义词,P(word)为词语word 在评论中出现的概率,p(word1&word2)为word1 和word2 在评论中一起出现的概率。如果PMI 值越大,则说明两个词语之间的关联性越强。如果PMI>0,则两个词语是正相关的,PMI 值越大,两个词语之间的正相关性越强;如果PMI=0;两个词语是统计独立的,不相关也不互斥;如果PMI<0,则两个词语是负相关的,也即互斥的。
计算完评论中的情感词与情感词典中的褒义词和贬义词之间的PMI 值之后,我们将词语与各个褒义词之间的PMI值加和再减去词语与各个贬义词之间的PMI 值,得到情感词的SO-PMI 值:
其中,m 为情感词典中褒义词的个数,n 为情感词典中贬义词的个数。SO-PMI 值可以看作词语的情感倾向,如果SO-PMI(wi)>0,则词语有积极得情感倾向;如果SOPMI(wi)=0,则词语为中性情感倾向;如果SO-PMI(wi)<0,那么词语有负面的情感倾向。将句子中的所有的情感词取平均值即可得到句子整体的情感值,将评论中所有的句子情感值取平均值即可得到整个评论的情感值emotion0,emotion0的情感值区间为[0,1],情感值越接近于1,情感越积极;情感越接近于0,情感越消极。
在Agent 情感量化方面,本文利用考虑性格因素的OCC模型[4]对情感进行量化
基本步骤如下:
(1)首先,将性格按人格五因素模型分为O,C,E,A,N 五种,令p={O,C,E,A,N},其中-1 ≤O,C,E,A,N ≤1,如表1 所示。
表1:
(2)使用PAD 模型描述心情,在PAD 模型中,P 代表愉悦度,A 代表激动度,D 代表优势度,Agent 的心情可以用向量PAD={P,A,D}T来描述,其中-1 ≤P,A,D ≤1,性格OCEAN 与心情PAD 的转化公式为:
表示成向量乘积为:PAD=M*p,其中M 为性格到心情的转换向量。
(3)在用PAD 模型[6]表达Agent 的心情之后,可以根据PAD 与Agent 情感的对应关系判断Agent 的情感状态。如表2 所示。
表2:
(4)根据P 值我们可以将Agent 的情感分为积极和消极两类情感,结合模型一得到的舆论情感倾向和Agent 情感态度可以提出不同的劝说策略,具体如表3 所示。
表3:
激励性情感劝说策略:Agent 以尽快达成一致意见为劝说目的,提出对双方有利的劝说方案,努力使双方利益都得到满足,如在必要时可适当降低劝说目标或采取一些让步。
引导性情感劝说策略:Agent 以自身利益最大化为劝说目的,围绕自身利益诉求展开劝说,努力使对方Agent 满足自身诉求,对于伤害自身利益的提议,要予以否决。
说服型情感劝说策略:Agent 以尽快与对方Agent 达成一致为劝说目的,从对方Agent 的角度出发,围绕对方Agent 的利益展开劝说。尽量满足对方Agent 的诉求,若在必要时,可牺牲己方Agent 的部分利益。
否定型情感劝说策略:Agent 以尽快结束劝说为目的,提高自身要求的利益目标,若己方提出的诉求不能被满足,就及时结束劝说过程。
本文以北京市碳排放权交易为例,进行算例仿真。
2.1.1 假设现有三条舆论
舆论1:“碳排放交易市场的发展必定前途无量”
舆论2:“看到碳排放交易市场的蓬勃发展,我感到很欣慰”
舆论3:“我不认为碳排放交易市场会迅速发展,我对其感到悲观”
对上述舆论进行分词,结果如表4。
表4:
2.1.2 提权关键字
在去除停用词之后,计算舆论中词语TF 值、IDF 值和TF-IDF 值,通过TF-IDF 分析,可以确认舆论中的关键词,本文因舆论样本数量较少,只论证步骤,不进一步展示。
2.1.3 情感分析
对上述舆论进行分词,结果如下:
在对分词结果去除停用词之后,计算每条舆论的SOPMI 值,结果如表5。
表5:
分别将舆论1、2、3 按0.5、0.3 和0.2 的比例赋予权重,可以得到舆论整体的SO-PMI 值为3.717,因此舆论情感为积极。
本文以北京市碳排放权交易中的采购方(买方)和转让方(卖方)之间正在就碳排放权交易进行劝说为例,现在以转让方(卖方)Es 要根据自身所处的劝说环境进行情感决策。
以卖方Es 来说,以满意这种情感为例,将满意情感的各属性权重依次设定为0.4,0.3,0.3,设Es 的个性向量为:
P=(0.4,0.7,0.6,0.5,0.5),则其对应的PAD 心情空间值为:
由此可见,我们可以判定出买方情感状态为放松,也即积极的情感状态。根据Agent 的情感及舆论情感倾向可以确定此时选择激励型情感劝说策略。之后,Agent 会将所选择的情感劝说策略发送给采购方,形成完整的情感劝说决策过程。
情感劝说的引入使我们更有针对性的分析人类在产生商业交易行为时的情感、愿望和其目标,与Agent 的有效结合也使得预测性更加准确。Agent 作为人工智能领域的重要代表,可以辅助我们判断商务交易双方的交易意愿,而考虑事件舆论是能帮助Agent 更好的模拟实际情况[7][8]。舆论往往从各个角度影响着事件的进程,交易双方的性格也会对具体的交易达成度产生影响。
本文将以上三种影响因素综合考虑后,借助Agent 的人工智能特性帮助模拟谈判交易过程,针对不同情况有方向性的采取恰当的劝说策略,更真实的模拟实际情况[10]。相比前人的研究,本文创新性的将舆论与交易双方性格及Agent情感评价模型结合考虑,将情感进行量化处理,多维度预测实际情况,提高劝说的效率,使Agent 更理性更科学,加快劝说进程,节约谈判成本。
在选取分析舆论中,因原始数据参差不齐、事件质量不均、分词器对文本的处理程度不定、舆论具有时代特性[10],许多网络热词会影响情感准确度的判断、即使通过文本误差纠正,经过加权和修正后的文本,仍然难满足很高的准确性,在判断舆论情感方向存在困难。在本文在假设的舆论下,因样本舆论数量较少,对模型的验证方面不全面,没有模拟并计算大样本下的结果。
本文研究的Agent 模型中情感的变化受到舆论的影响仅停留在理论层面,缺少更多的实际舆论信息及交易数据支持,具体可操作性难以判定。本文Agent 劝说虽已结合舆论的变化,但因舆论和交易双方的心情是动态变化的,本文的模型和研究在实时性方面还有所欠缺,不具备根据事件舆论的变化实时更新劝说策略。下一步可以考虑对不同舆论环境下Agent 情感劝说的实时性展开研究。