基于语素的金融证券域文本情感探测

2021-12-11 20:10卫卫
安家(校外教育) 2021年51期
关键词:情感分析金融信息

卫卫

摘要:伴随着我国对于数据挖掘以及自然语言相关技术的不断提高,在Web上研究者也加强了对资源的关注力度。但由于现阶段金融证券领域缺乏一定的情感语料库,因此将情感分析加入到金融证券域内相关技术的应用情况十分少见。面对数量巨大的非结构化Web文本金融信息,加强对金融信息领域特征的考虑,充分利用基于语素的金融证券域文本情感的计算方法对Web文档的情感分析有着巨大影响。

关键词:金融信息,情感分析;领域特征

中图分类号:G4 文献标识码:A

一、引言

公众可以通过Web新闻或者论坛的方式对上市公司进行一定的评论,同时结合一定的计算方法对每个文档计算出一个情感值,情感倾向主要通过情感值来体现,而文档的倾向强度则是由情感值的绝对值进行控制。运用基于语素的金融证券域文本情感这一计算方法,可以避免资料库缺少这一局限性,在不断实验数据以及结果来看,这种方法可以高校的分析出Web金融信息的情感倾向。

二、相关工作

使用文本情感分析方法已经成为目前一种相对前端的分析手段,而在金融证券域中的全面开展,就需要立足于金融证券域的实际需求。从现阶段对情感倾向性的研究来看,主要分为两种:一种是利用机器学习的方法进行文本分类,将文本放置到特定的类别中,即正向或者负向;另一种则是给文本计算一个情感倾向值,倾向性则是通过值的符号来体现,而倾向强度则是通过值的绝对值大小来体现。

要在金融证券域中应用这种方法,主要从以下几点展开:①对不同种类的相关对象进行分类。在具体分类过程中,很难考虑到所有方面,主要立足于我国证券的主要实施情况;②要有一定的时间限定,指的是在某一时间段内应该对什么类型的文本信息进行提取,这能才能够满足不同经济指标的基本平衡;③对文本信息量进行确定。如何把握选取文本量与质的关系,也就是在相对的量内选择能够体现情感倾向的典型文本。想要完成好这些基础性工作,就必须进行全面性的阅读和学习,从而得到一些学术上的基础。同时也要对文本信息的时段、真伪情况以及发布主体进行仔细辨别,确保文本的全面性,从而提高结论的公正。

三、基于语素的文本情感分析

3.1基础框架

任何一项工作的开展都需要在一定的框架范围内实行,因此,基于语素的金融证券文本情感探测也需要建立一定的框架。从当前Web上金融信息的基本内容来看,主要包含两类:一种是不同金融网站的新闻、专家品论、公告等等;而另一种则是不同股吧论坛上的帖子。前者的褒贬性不明显,但内容具有一定的真实性,通常被选作研究对象。

因此,在对金融证券进行框架构建时,首先据需要针对金融证券产品实施文本情感探测,选取的目标也要具有一定针对性,其应具有一定的典型性、代表性。同时在对对探测内容进行框架构建时,就要以企业的经济数据作为基础,立足于金融证券域内的评价、评论以及基本预测,对于一些情感倾向性强的文本信息,应该进行归纳、综合、分类以及提取。

3.2种子集选取

在建立的框架内,通过针对性选取,例如相关各种典型的预测以及企业走向较为理性的评价等等,并对其进行选取甄别,在大量信息中总结出具有一定规律的结论,从而指导不同主体的具体发展。而在实际的工作过程中,需要大量的精力用在具有一定代表性的不同情感倾做为选取目标。特别需要注意的基本原则是,对于选取的情感文本不能融入自己的情感倾向,以一种相对客观的心态面对文本信息。从现阶段金融证券于的基本情况来看,其并没有现成的情感此点,因此需要从现阶段金融证券语料库出发,对所需的情感词典进行构造,首先就是对正向种子集和负向种子集进行定义,并根据同义关系或者反义关系对其进行扩展。

3.3文档情感倾向性计算

这里所讲的倾向性,主要指的是不同的相关主体,在对相关经济形式的具体观察下,从而产生的具有一定个人枪杆的评论等等,虽然其中包含了一定的个人主观色彩,有着不同种类有利于个人的祈祷祝福,但是其中仍然具有较多的理性成分。在通过对文本中的词汇、语句甚至是整篇文芳的格局处理等进行分析,都可以得到相对文档并且能够用于计算的可靠数据,从而结合企业发展的数据得出合理的结论。因此,在计算过程中要以文本的细粒度做为基本,从而展开情感属性的相关研究,尽可能地將设计相关政府舆情分析、企业的发展趋势以及其他主体的个人追求分析,都需要在计算过程中包含进去,这样才能够得到经济的综合运算结果。

同时,对于文档倾向性的计算主要可以从三方面进行,分别是词汇级别、句子级别以及文档级别。由于情感词的倾向做为一个句子甚至一个文档的情感倾向的具体表现,充分利用建立好的词典对情感词倾向进行计算:

3.3.1词的情感倾向性计算

组成词的语素情感倾向决定了次的情感倾向,因此,可以通过组成词的语素情感分数来计算次的情感倾向值。在一个语素中,当其出现在正向情感词典中的次数较多时,则这个语素更倾向于褒义;反之,在负向情感此点中的次数较多时,则这个语素更倾向于贬义。

3.3.2句子情感倾向性计算

构成句中情感词的倾向决定了句子的情感倾向。由于否定词会使情感词的极性反转,这就导致在计算句子情感倾向值的时,要考虑否定词的具体作用。同理,程度副词也具有于否定词相同的结果,因此也要考虑其中。

3.3.3文档情感倾向性计算

通常情况下,人们总会将一些重要的、能够表达观点的句子放在相对显眼的位置,例如标题、段首、段末等,因此,在计算一个文档的整体倾向性时,需要考虑情感剧的位置对情感值的印象影响。

结语:在对金融证券域语素的文本情感的不断分析我们可以认为,情感文本探测是现阶段各相关主体的认识动态的重要指标。应用这种探测方法,需要坚持不懈,并且在其他相关分析软件的原有基础上进行不断研发,这样就可以为其他主体提供相对全面的思考。从现阶段金融证券域的情感探测领域来看,仍然缺少针对性较强的分析原件,这就需要相关技术人员以及专业部门提高科研力度,以期在金融证券域的语素情感倾向探测上取得全面应用。

参考文献

[1]李国林,万常选,边海容,杨莉,钟敏娟. 基于语素的金融证券域文本情感探测[J].计算机研究域发展,2011,(48):54-59.

[2]梁利高.基于语素的金融证券域文本情感探索[J].财政金融,2013,(14).

猜你喜欢
情感分析金融信息
动态信任视角下消费金融信息产品设计与评价
银行、支付机构不得收集与业务无关的消费者金融信息
基于语义的互联网医院评论文本情感分析及应用
基于双向循环神经网络的评价对象抽取研究
基于SVM的产品评论情感分析系统的设计与实现
基于词典与机器学习的中文微博情感分析
在线评论情感属性的动态变化
文本观点挖掘和情感分析的研究
媒体融合时代金融信息服务业如何转型升级
个人金融信息保护探析