网智天元:感知声誉风险背后的“情绪”

2020-04-24 00:30韩丽佳
软件和集成电路 2020年3期
关键词:声誉管控情绪

韩丽佳

风险的不确定性是会随着时间而变化的,影响未来不确定性的因素之一是信息的不对称,风起于青萍之末,风险来临之前早有苗头,早一点抓住舆情的尾巴,就能早一步规避风险。

2008年3月19日,英国伦敦,一份神秘的邮件顷刻搅乱了伦敦的证券市场,这封邮件里说,我们暗中得知苏格兰哈里法克斯银行现已陷入巨额的非客户债务危机,并且该银行已经向中央银行申请紧急融资救援。这则消息在伦敦股市的发酵引发了苏格兰法克斯银行和其他银行股价的大跳水,而这时苏格兰哈里法克斯银行和中央银行延迟的辟谣声明已经挽救不了股价下跌的势头,安抚不了急于抛售股票的股民心中的躁动。

2009年1月巴塞尔委员会新资本协议征求意见稿中明确将声誉风险列为第二支柱,成为商业银行的八大风险之一,并指出银行应将声誉风险纳入风险管理的流程中,在内部资本的流动性预案中适当覆盖声誉风险。声誉风险指的是金融行业所涉足经营、管理及其他行为活动或外部事件造成的利益相关方对金融行业机构负面评价的风险。

上述案例中,无人意料的恶意谣言导致银行的声誉受损,使客户与银行之间产生信用危机,简单地来说就是银行一方知道自己并没有债务偿付能力不足的问题,而客户却坚持对此持有怀疑态度,银行和客户之间无法达成信息数据的共识。

“金融的核心是信用,信用的核心基于数据的共识。风险形成的根本条件其实就是信用被破坏而引发的未来不确定性。”网智天元集团首席战略官(以下简称网智天元)莫倩这样说道:“风险的不确定性是会随着时间而变化的,影响未来不确定性的因素之一是信息的不对称,风起于青萍之末,风险来临之前早有苗头,早一点抓住舆情的尾巴,就能早一步规避风险。”网智天元的金融机构声誉风险管控大数据平台要做的不是事后“救火”,而是事前“防火”,从“应对风险”向“驾驭风险”转变。

护航声誉,难关在前

莫倩提到,“金融行业信息化面临着两个巨大的挑战:一个是外部数据带来的数据类挑战,一个是智能技术带来的技术类挑战。”

这两类挑战不能孤立地来看,而要以联系的角度看待,互联网、大数据、云计算、智能终端和AI等技术给信息传播环境和舆论生态带来了翻天覆地的变化,每日产生的数据呈现出指数级的爆发,出现了更多的言论出口、更多的信息传播渠道,这些给经济和社会生活带来愈来愈多的不确定性,各类组织和机构也面临着各种如同“黑天鹅事件”般的声誉风险。特别是在金融行业里,声誉风险危机的爆发和应对,会造成资本缩水和大量的利润流失。反过来看,越来越多的数据积累又给信息技术和大数据技术的发展提出了更高的要求。

传统风险管理的概率预测和内部控制,已经无法满足管理声誉风险管控的要求,企业亟须新的知识、方法和工具。在开拓新道路、新方面的过程中网智天元面临着以下四个方面的问题:

一是信息抓取及筛选受限。根据国际市场研究IDC的最新报告,非结构化数据占据了当前数据海洋的80%,并且在2020年以前以44倍的速度持续增长。

移动互联网时代下的互联网信息爆炸式增长,使得声誉风险管控采集信息不全面这一问题更加突出。

二是数据处理不全面。面对日益紧密的互联网的网络结构,用户之间呈现出多渠道、多层次的立体交互,产生的数据也更加多元化、复杂化、情绪化。这种基于各种强弱关系的网状结构,也直接使声誉风险能够快速成型、发酵,短时间内可以多次转向。

Web2.0时代的声誉风险管控,更关注“关系”,“关联关系的寻找对计算能力的需求是非常惊人的,以3步关联为例,现在能够用到的企业的数据条数为1.9亿,3步关联就是(1.9,x)与(1.9,x)集合的笛卡尔乘积,这是难以想象的关联暴涨。”莫倩解释道。

三是声誉风险预警不及时。信息采集的不全面加上数据算法不够准确、数据分析过程的繁杂,会影响最后监测结果的准确度以及数据推送速度,從而导致声誉风险预警不准时、不准确。

四是缺乏对声誉风险的分析和应对能力。传统的声誉风险管控将监测的对象简化为独立的信息元,也就是针对特定的信息、个人、事件进行分析,欠缺分析信息舆论之间联系的能力和预测能力。

如分析网民观点或声誉风险走势时,传统的声誉风险管控只关注网民跟帖态度和情绪,忽视了网民心理的变化;只关注文本信息,而较少关注图像、视频、语音等内容;只观察舆论局部变化,忽视其他群体的舆论变化;只解读网民文字内容,而忽视复杂多变的社会关系网络。如此单一化的分析无法挖掘寻找数据之间的联系,确立数据之间相关关系的规律,也就无法有效分析并持续跟踪风险,提高对声誉风险危机的分析力和预测力。

网智定标,情感卡位,测风险

为了第一时间发现风险的苗头从而做出预警,网智天元着重加强了金融机构声誉风险管控大数据平台两个方面的能力:第一个方面是全球全量数据的采集能力,第二个方面是基于知识图谱的关联能力。并且莫倩表示:“网智天元是国际IEEE P2807知识图谱标准制定的核心参与方,参与标准的制定是对我们技术能力最权威的认可。我们是舆情分析领域里最懂金融的,我们制定了中国保险行业的声誉风险指数,这也为我们赢得了客户的信任和认可,建立起稳固的信用共识。”正是这种底气与自信,让网智天元在声誉风险管控领域顺势而为,如日方升。

莫倩提到,与其他同类型的产品相比,网智天元的金融机构声誉风险管控大数据平台以情感流为其特色方向,引入情感分类技术,感知声誉风险背后的“情绪”。从声誉风险分析角度看,网民仅仅是信息海洋中的"孤独僵尸",犹如蚁群能够涌现高度智能,而单个蚂蚁如附热锅到处乱窜。这些“热锅上的蚂蚁”所暴露出来的信息,能够让金融机构见微知著,进一步提高在声誉风险来临前的敏感度。

金融机构声誉风险管控大数据平台引入网智天元的情感倾向性分析技术,可以实现声誉风险正负面的判定。通过进行数据分析获知人们的情绪、态度、日常行动的变化,实现对声誉风险发展的预测。

黑天鹅的“势”与“防”

莫倩表示声誉风险监测的未来式是预测,是对未来态势的研判,它的普适性很强,因为声誉是一个具有品牌企业的生命线,声誉风险管控可以应用到很多领域,更重要的是它让我们在面对“黑天鹅事件”时不再措手不及。

苏格兰哈里法克斯银行声誉风险案例其实就是一个典型的“黑天鹅事件”,面对具有极大意外性和危害性的“黑天鹅事件”,莫倩提出网智天元要把控的是未来的势。“如转圆石于千仞之山者,势也”,木石的性情就是在处于平坦的地势上静止不动,处于险要的山坡就滚动。

“善战者,求之于势。”莫倩说,“对未来趋势的预测、预判是实现大数据变现的一个很重要的领域,趋势一旦形成,要逆转、不变化是很难的,所以我们要做的是看清趋势,提前布局,顺势而为。”

最佳实践:金融机构声誉风险管控大数据平台

行业背景

当今世界正迎来新一轮的科技革命和产业变革,数字化的浪潮蓬勃兴起。推进数字化转型已经日益成为各国金融业提升服务水平和竞争能力的共同选择,人工智能、大数据、云计算、移动通信等现代信息技术正以前所未有的程度与金融业紧密融合,这为金融业的数字化转型创造了难得的历史机遇,也提供了更加优异的技术条件。

从改革开放初期到20世纪末,在国家的统一部署和统筹引导下,我国金融业依托计算机技术、网络技术等科技手段,以操作电子化、系统联网化、标准统一化为重点,深入探索金融电子化之路,从金融电子化逐步发展到金融信息化,乃至到今天的数字化金融,实现了从无到有、从手工到电子、从单机到联网的历史性突破。

进入21世纪,特别是在我国正式加入世贸组织后,金融业在电子化建设的基础上充分运用信息通信技术、数据库技术等新手段、新工具,重点围绕数据集中化、渠道网络化、管理信息化等领域持续提升金融信息化水平,实现了从分散到集中,从业务信息化到管理信息化的跨越式发展。

当前,在国家整体信息科技实力不断提升的基础上,金融信息化继续深入发展,以移动金融、互联网金融、智能金融等为代表的金融新业态、新应用、新模式正在蓬勃兴起,传统金融机构和金融科技公司良性竞合的关系初步形成,我国金融业总体科技水平和应用创新能力已跨入国际先进行列,这为数字化转型提供了宝贵的实践经验和较好的技术基础。金融行业、传统金融经历了从金融数据/金融信息、金融大数据/互联网金融,到数字金融/金融科技,未来是普惠金融/智慧金融。

核心功能

在大数据技术背景下,基于互联网的声誉风险管控预警系统以“一切数据皆信息”为理论出发点。金融机构声誉风险管控大数据平台综合了先进的精准搜索引擎技术、深网信息集成技术和知识图谱、观点挖掘技术,可以对各种来源的数据信息进行采集、抽取、分析、分类和追踪等,打破了传统声誉风险管控的局限性,解决了原有的各种痛点。网智天元金融机构声誉风险管控大数据平台基于以下五大核心优势突破传统,防范把控风险:

1.引入精准搜索引擎技术,数据获取更高效。

网智天元为金融机构搭建的声誉风险管控大数据平台,引入先进的网络采集技术,采用有效的信息识别和采集预测算法,可以减少不必要的信息获取,实现针对性地获取目标信息;同时,不断改进采集系统的整体设计和采集模型,优化每一个可能的环节,从而提高信息的采集效率。

2.引入信息排重技术,提高处理信息的效率。

有研究表明,将近30%的网页是重复的,这会导致因同一个网页被不断转载而造成采集重复。而解决海量Web信息最直观的方法就是提高采集的效率,这样在相同的时间内可以获得更多的信息。

针对Web信息采集中重复问题,运用BloomFilter算法,采用了综合排重技术,能够根据URL直接去重,同时还要能够根据内容比较去重。通过去重引擎自动标记存储重复的链接和内容相同的链接,在显示信息标题后标注该网页重复数并提示用户,这种处理方法可在本地查询到稿件的相似报道。这种技术非常适合处理海量网页的查重,不会因为处理规模的增大而影响处理的效率。

3.引入分类聚类分析技术,打通多来源数据之间的关系。

网智天元拥有自主知识产权的自动分类技术和产品(WiseTCS自动分类系统,软件著作权号:2009SRBJ5951),引入自动分类技术,可以实现对信息数据的自动标引、分类、发送和存放,避免用户在浩如烟海的信息资源中逐条搜索浏览。所有采集数据经自动过滤、去重、分类等初筛处理后,才作为推送数据推送到声誉风险管控报告中。整个过程可以实现分类准确率达91%,而且分类速度快,每秒处理达50篇以上。

此外,系统支持基于统计的文本信息处理方法来实现信息的自动聚类,根据其内容主题进行自动分组。自动聚类功能可以对采集信息内容进行热点分析和识别,并图形化展示聚类结果和热点趋势,让声誉风险管理者对声誉风险信息一目了然。

4.引入情感分类技术,感知声誉风险背后的“情绪”。

在传统数据时代,网民仅仅是信息海洋中的"孤独僵尸",犹如蚁群能够涌现高度智能,而单个蚂蚁如附热锅到处乱窜。金融机构声誉风险管控大数据平台引入网智天元的情感倾向性分析技术(雀灵情感自动分类系统,软件著作权号:2013SR116898),可以实现声誉风险正负面的判定。通过进行数据分析获知人们的情绪、态度、日常行动的变化,實现对声誉风险发展的预测。

5.引入话题追踪技术,发现声誉风险演化规律。

网智天元拥有自主知识产权的话题追踪技术和产品(WiseTDT专题追踪系统,软件著作权号:2009SRBJ5946),利用此技术,金融机构声誉风险管控大数据平台可以发现并跟踪和声誉风险密切相关的网络群体事件、网络话题、社会关系等,实现网络社区的发掘、社会关系挖掘、话题识别与跟踪、声誉风险源头的发现与扩散轨迹分析、网络群体事件的发现与追踪、关键声誉风险的演化行为规律发现等。

方案价值

依托领先的声誉风险监测预警技术和人工智能分析技术,网智天元11年磨一剑,建立了一整套完善的声誉风险管控服务体系,为政府、企业和社会知名人士量身定制了集声誉风险监测预警、智能分析研判、声誉风险危机处理、品牌优化推广,以及网络安全管护为一体的系列服务产品,覆盖声誉风险发展的各个环节,真正实现敏感风险早发现、早筛查、早预警。网智天元以声誉风险管控应用为辐射中心,延伸出以下三个方面的技术展望:

第一个方面:数据采集多样性。大数据时代,突破了传统数据时代片面化、单一化、静态化的思维,开始立体化、全局化、动态化研究声誉风险数据,将看似无关紧要的声誉风险数据纳入分析计算的范围。

在大数据技术的加持下,信息采集的范围扩大为所有中文网站、BBS论坛、贴吧、博客、微博客、QQ空间、重点纸媒(无网络版或网络版不全)、重要外媒(中英文)、重要电视台、视频网站、广播等。网络信息需实时更新,纸媒、视频、音频内容应在出刊后12小时内更新。从网络采集的声誉风险信息将存储到声誉风险管控数据库中,可通过搜索引擎对海量的声誉风险数据进行实时检索。

第二个方面:数据处理及信息统计能力。声誉风险管控数据库中的信息可根据实际需求进行有效分类(例如地域、媒体平台、金融机构类型、业务内容、正面或负面、负面级别等),经过加工处理后发布到监测平台Web界面上并展示给用户。

在信息分类基础上,根据需要进行各种数据采集和统计(如分银行类型、地域、业务类型进行季度、年度统计,对同一银行全年负面新闻进行总量统计等)。统计结果以列表或图表的形式展示,并以Excel文件格式导出。还可分别实现对全行业全系统信息、科技信息的汇总功能,定期以日报、周报的形式将重要信息汇总并展示。

第三个方面:全面监测,及时预警。数据背后是网络,网络背后是人,研究网络数据实际上是研究人组成的社会网络。大数据技术预测声誉风险的价值实现,最关键的技术就是对声誉风险数据间的关系进行关联,将不再仅仅关注传统意义上的因果关系,更多关注数据间的相关关系。按大数据思维,每一个数据都是一个节点,可无限次地与其他关联数据形成声誉风险链上的乘法效应,类似微博裂变传播路径,数据裂变式的关联状态蕴含着无限可能性。

猜你喜欢
声誉管控情绪
突出矿井大采高综采工作面过断层风险管控研究
短期与长期声誉风险的不同应对
农村信用社信贷风险管控思考
Top 5 World
中美防长在新加坡谈管控风险
审计师声誉与企业融资约束
审计师声誉与企业融资约束
小情绪
小情绪
小情绪