智能节目辅助主持机器人系统与推荐算法

2022-02-08 01:05王素芳陈志成
重庆理工大学学报(自然科学) 2022年12期
关键词:提取阅读理解

王素芳,吴 晨,陈志成

(1.焦作师范高等专科学校 信息工程学院, 河南 焦作 454000;2.北京工商大学 计算机与信息工程学院, 北京 100048:3.北京格分维科技有限公司, 北京 100070)

0 引言

随着计算机技术的发展,人工智能应用正在不知不觉融入到我们的日常生活中,通过手机语音助手一句“HI,Siri”或者“小爱同学”,手机就能听懂你的指令,帮助你来完成原本要靠点击才能完成的任务。又如,智能音响设备、智能车载设备、智能家具设备、商场导购机器人、会上下楼的送菜机器人、送快递智能车、无人驾驶车辆。人工智能技术利用大数据、计算机科学技术帮助用户完成繁琐或者是人类无法完成的任务。

电视节目主持人是一个需要大量记录对话内容的职业,其主要职责是组织串联节目中的每个环节,称为串场。同时还要面对节目演播现场临时出现的各种问题,节目嘉宾提出的问题,压力巨大。智能机器人则不会出现这样的压力,并且可以利用计算机强大的记忆能力和强大的互联网络资源,能够快速检索出各类知识内容解答现场提问。因此智能机器人非常适合作为辅助主持人加以利用。

目前已有一些电视节目中采用机器人做些辅助主持和分析。公认的世界上首位节目虚拟主持人是2001年的Ananova[1],诞生在英国。之后,美国、日本、韩国也纷纷推出了虚拟主持机器人。2017年,微软“小冰”以无形象的方式登陆天津卫视《非你莫属》节目,是此前国内有代表性的一次尝试[2]。2018年以来,人工智能技术越来越多地被应用到电视节目中[3],出现了“人工智能主播”[4],虚拟智能机器人可以参与交流互动和提供问答咨询[5]。这些新技术的应用给电视节目主持带来了新的人机交互视角[6],增加了节目亮点,促进了新技术和新媒体的融合发展。

本文介绍的是基于中央电视台创业投资栏目的需求而设计开发的一款人工智能虚拟辅助主持机器人——小创哥。小创哥是以卡通形象登上电视荧屏,在智能对话的同时能够做出相应机器人动作。其在节目中的用途主要包括两方面:一是与真主持人搭档,辅助现场主持,增加智能交互;二是通过数据分析,合理推荐投资项目和投资人。

1 相关工作

1.1 知识问答系统

知识问答系统是自然语言处理领域重要的研究方向之一,其目的是让机器能够像人一样交流思考并解答问题。1950年英国著名数学家图灵在《Mind》上发表论文《计算机器与智能》,提出机器智能概念和机器智能测试实验方法“图灵测试”[7]。此后,西方国家出现了一批面向专业领域的问答系统,例如,面向精神疾病的ELIZA[8],面向美国篮球联赛的Baseball问答系统[9]。20世纪90年代由麻省理工学院开发出的START问答系统是世界上第一个开放领域问答系统[10]。进入21世纪,IBM的问答系统Watson、苹果的Siri出现后,问答系统应用开启了爆发式增长,其中主要有基于知识库的问答系统、基于社区的问答系统和基于Web的问答系统。

基于知识库的问答系统[11],以知识库中的内容作为知识来源,知识主要以三元组“实体,关系,实体”或“实体,属性,属性值”的方式存储在知识图谱或结构文档中。如何构建知识图谱和如何查询知识图谱是其中2个重要研究方向。基于社区的问答系统[12],以问答社区为知识来源,主要研究内容为问题分类、问句匹配以及答案筛选。问题分类目的是缩小问题搜索范围,提高答案获取精度。问句匹配是通过实际问题文本与问答对问题文本进行比较,又分为文本相似度比较和语义相似度比较,找寻相似问题进而得到答案。答案筛选是从多个答案中选出最佳答案。基于Web的问答系统[13],以互联网作为知识来源,利用搜索引擎搜索网页中包含的问题答案。优点是不需要提前创建准备知识数据,能够随时获得最新的知识内容。缺点是网页搜索答案不够精准,相对于知识库或社区问答系统来说难以保证问答效果,需要的研究内容包括问题关键词提取、问题重写、阅读理解、命名实体识别。

本文综合考虑不同答案来源的问答系统的优缺点,构建了适用于电视节目录制场景的辅助节目主持机器人问答系统。

1.2 推荐系统

推荐系统是数据挖掘研究领域的一个应用研究方向。传统的推荐算法分为5类:基于内容的推荐算法、基于协同过滤的推荐算法、基于知识的推荐算法、基于关联规则的推荐算法以及混合推荐算法。

基于内容的推荐算法[14],是根据用户之前对项目的评分,学习用户的偏好,推荐与用户偏好相似的内容给用户。优点是不需要用户历史数据,不存在新内容冷启动问题,缺点是存在新用户冷启动问题,推荐结果多样性差。

基于协同过滤的推荐算法[15],分为用户协同过滤算法和项目协同过滤算法。通过相似用户对内容的兴趣也相似的前提条件作为基础,前者向相似用户推荐相同内容,后者向同一用户推荐相似内容。优点是推荐具有多样性,会推荐用户未知的新内容给用户,可用于多媒体领域,缺点是存在新用户和新内容冷启动问题,对于用户评分数据有强依赖性。

基于知识的推荐算法[16],是通过用户给出的需求,将需求转化为规则,并根据规则推荐相应的内容,优点是没有新用户和新内容冷启动问题,推荐结果具有可解释性,缺点是需要构建知识库,算法可扩展性差。

基于关联规则的推荐算法[17],如果用户对某个内容感兴趣,则该用户可能对与该内容相关的其他内容感兴趣,将相关内容推荐给用户。优点是易发现新的内容兴趣点,不需要领域知识,缺点是个性化程度低,关联规则提取复杂。

混合推荐算法,是利用上述推荐算法其中的2种或多种算法组合,生成更优推荐结果。

2 虚拟主持机器人系统设计

本节目主持机器人的系统设计主要包含:总体网络架构设计、交互控制流程设计、知识库系统设计。系统采用JAVA web 技术实现,方便进行后台数据的更新管理工作以及各功能模块调用。

2.1 系统网络架构设计

根据节目录制现场的网络环境要求,在原有的网络系统中,增加主持机器人的网络系统,具体如图1所示,各部分之间的交互序列如图2所示。

图1 节目主持机器人网络架构

图2 节目主持机器人交互序列

主要包含如下4个部分:

1) 人工智能算法服务器,其中安装了人工智能语音识别、人脸识别、命名识别、知识库系统等;

2) 机器人主控系统,分别与服务器和导播指挥系统相连,根据节目现场情况实时进行数据分析;

3) 导播间的指挥命令信息采集系统,根据导播指挥信息对机器人下达动作命令;

4) 现场人机交互系统,根据现场主持人、投资人、创业者之间的对话交流情况,进行实时信息获取,经过分析后给出相应回复和进行互动。

2.2 知识库系统设计

分析该投资节目的“角色”,主要包含:主持人、创业者、投资人三类。根据这些角色建立相应的知识库,如表1所示。

表1 节目主持机器人知识库系统

2.3 问答分析系统实现

节目主持机器人系统中运用了多项自然语言处理技术,深入理解分析语音识别结果文本,首先利用文本纠错技术对语音识别中识别错误的词语进行自动纠正,并利用分词、词性标注、命名实体识别、依存句法对文本进行初步分析。之后进行文本语义理解,明确对话意图。当对话意图识别为回答问题时,系统按照问题类型检索知识库、知识图谱或者互联网络获取对应答案或知识,之后进行答案梳理,在候选答案中选择最优答案进行语音合成返回到节目现场。此外,虚拟机器人还可以像主持人一样向创业者提出问题,这些问题在节目播出前预先输入到系统中,当系统对话意图识别为需要进行提问时,机器人会自动出现在屏幕上并提出问题请创业者或投资人进行回答。

基于自然语言处理的机器人问答系统架构如图3所示,其中主要用到文本纠错、词法分析、命名识别、问答检索等技术。

图3 机器人问答系统架构图

1) 文本纠错:语音识别后文本纠错[18]是问答意图正确识别的重要保障,语音识别的错误将导致后续步骤的错误。通过大量系统测试后总结发现,语音识别中出错的情况主要是同音词错误和因口音问题导致的近似音识别错误。在错误中,以人名、机构名命名实体为主。系统通过规则模板以及深度学习技术进行了针对性错误检测及错误纠正。

2) 词法分析:主要包括中文分词、词性标注、命名实体识别、依存句法分析。中文在词与词之间不存在英文中的空格分隔,使得中文语义分析上受到词边界错误影响。分词技术能使中文语句具有语义合理性词汇序列。词性标注,是为每个分词后的词语标注唯一词性,有助于后续依存句法分析。命名实体识别,专门识别语句中具有特定含义的实体,这些实体经常是问答中的关键性信息。依存句法主要是实现语句中词与词之间相互关系的识别,如主谓关系、动宾关系、定中关系。通过句法分析,可以抽取句子其中的语义主干,帮助智能机器人系统实现对对话意图的精准理解。

3) 命名识别:命名识别属于自然语言处理领域词法分析中的一部分,主要解决机器人系统未注册的名词识别问题,主要包括人名、地名、机构名或是专业领域名词,这些词汇在通用语料中出现次数少,但是对于问答、信息检索任务却是关键。该项技术应用在节目主持机器人系统中[19],通过网络爬虫技术获取了49 270个投资领域新闻标题,并利用领域词典进行了初次标注,对严重标注错误进行了人工校正,实现了机器人系统自动识别交流问题中的命名实体,最后生成相应的知识图谱。

图4为以某投资工场为例生成的知识图谱,从投资领域、管理团队、投资年份、投资企业数量、企业创立日期、投资企业所在城市等维度全面展示了该投资工场的情况。

图4 投资工场知识图谱

4) 问答检索:当对话意图识别为回答问题时,系统将依据问题类型的不同,进行知识库或知识图谱搜索,系统设定高阈值来保证回答的准确率,知识库中的结果将直接返回,知识图谱中的结果将按不同内容对答案进行模板封装然后返回,如果知识库和知识图谱中都搜索不到结果,系统将利用搜索引擎,在互联网中搜索相应答案,如果存在结构化答案,系统优先选择结构化答案,如果不存在结构化答案,系统将大量爬取相关搜索结果,利用阅读理解的深度学习方法,从中总结抽取正确答案。在之前的节目录制中,我们构建的知识库及知识图谱成功完成了绝大部分问题的回答,只有极少数问题应用到了网络搜索步骤,系统应用效果良好。

在某期节目中,主持人与机器人之间的实际互动示例如下:

主持人:“小创哥”。

机器人:大家好,我来了。

主持人:你看到刚才那个水下机器人了吗?是你厉害还是刚才的水下机器人厉害?

机器人:我太难了!同是机器人,相煎何太急。我会说话但不会游泳,它能游泳但不会说话,所以我总结一下,我们俩在不同领域,都各有作为。

主持人:还是你比较厉害,好,谢谢“小创哥”。

机器人:告辞。

3 智能投顾推荐算法模型

通过对节目组给出的节目资料进行数据挖掘与分析总结,对最终成功签约影响较大的因素主要有3个,分别是:

1) 投资人本人关注投资领域与创业者创业领域是否匹配;

2) 投资人本次出资金额的多少与创业项目所需资金是否匹配;

3) 投资人与创业者现场交流互动情况。

对这3个因素进行分析,建立了“智能投顾算法模型”,在节目录制过程中,现场实时计算投资人与创业项目的匹配程度,当创业者咨询时,给出创业者选择投资人的建议。

3.1 投顾算法计算模型

根据分析多期创业投资节目情况,建立了投顾推荐模型,其计算公式分为4个部分,最后将4个部分得分依照权值相加得到最终得分,这一组5个公式共同组成投资推荐算法模型。

(1)

(2)

(3)

(4)

si=αxi+βyi+δzi+mi

(5)

以上算法阐述如步骤1—步骤6:

步骤1首先计算投资人关注领域与创业者创业领域契合度xi,计算公式如式(6)所示。

(6)

其中:ε为创投领域契合度最低限度值,γ为单领域匹配加分,ni为第i位投资人关注领域与创业者创业项目所属领域相关个数。

步骤2计算投资人意愿出资金额与创业者融资需求匹配度yi,计算公式如式(7)所示。

(7)

其中:gi为第i位投资人意愿出资金额,e为创业者融资需求。

步骤3计算投资人与创业者现场交流匹配分数zi,计算公式如式(8)所示。

(8)

其中:di为第i位投资人与创业者交流次数,max(d)为现场全部投资人中与创业者交流次数最多的投资人交流次数,η为交流基础次数。

步骤4计算投资人出资金额高于创业者融资需求时的附加分数mi,计算公式如式(9)所示。

(9)

其中:γ为单领域匹配加分,e为创业者融资需求,gi为第i位投资人意愿出资金额。

步骤5将式(6)—(9)的计算结果依照投资因素占比重要性加权求和,得到最终匹配分数Si,匹配分数最高的投资人,是系统所推荐选择的投资人,计算公式如式(10)所示。

si=αxi+βyi+δzi+mi

(10)

其中:xi、yi、zi、mi分别如前述含义,α、β、δ分别为各关注项的权值系数,根据以往统计分析结果,一般设定α=0.2、β=0.5、δ=0.3,根据不同项目类型有所适当调整。

步骤6对步骤5所得匹配度分数Si进行最终合理性校验,如果在该项目创业者和投资人所属的范围之内,则最终确定该结果为推荐值,如出现偏差超出期望值范围,则调整前面步骤的相应系数,重新计算Si结果,直至最后选择推荐出相对更为合理的投资人为主。

另外也有个别异常情况,比如全体投资人都放弃投资,全部灭灯,则该项目最终投资失败,这种情况下,机器人推荐系统也同样可以给出投资匹配度,只是分数极低,当匹配度低于0.5时,系统不建议选择投资人。

3.2 关注领域分析

据不完全统计,有643位来自不同领域的创业者通过层层选拔登上了央视创业节目舞台,对这643位创业者的创业领域进行统计,创业项目最多的8个领域分别是互联网373项,软件应用251项,生活服务182项,智能制造132项,教育89项,医疗卫生74项,文化创意73项,新材料65项,如表2所示。图5是通过643位创业者项目介绍词生成的词云,通过词云也可以看到平台、服务、技术、智能等关键词的出现频率较大。

表2 项目领域占比

图5 项目领域词云图

系统定期更新投资人信息知识图谱,获取现场各位投资人的投资关注领域信息,并通过创业者项目的介绍词,利用提前训练好的分类模型自动对创业者的创业领域进行识别。如果创业者的创业领域与投资人关注领域中的其中一个或多个相同或相关,系统给出较高分值。如果领域不相关,或者投资人很少或没有投资过创业者所在的创业领域时,系统给出较低分值,但不是零,因为投资者很可能在这期节目中看好这个项目而投资。

3.3 出资金额分析

通过对节目资料进行梳理统计,往期创业者融资需求从200万~3 000万不等,相比创业者的融资需求,投资人给出的出资金额相对较低,最少只有50万元,在签约成功的项目中最终价格50万~200万(不含)占比3.07%,200万~600万(不含)占比38.51%,600万~1 000万(不含)占比52.48%,1 000万及以上占比5.94%。

融资失败很大原因在于投资人出资金额和创业者融资需求相差过大,出资金额对能否成功签约影响较大。在节目演播现场,实时获得投资人出价信息,并对比创业者的融资需求,金额不足时系统按比例计算分值,出价超出融资需求时系统在计算总分时会给予投资人计算加分。

3.4 现场交流分析

系统利用语音识别和人脸识别技术,识别分析投资人的发言交流和面部表情情况,得出每位投资人在面对创业者时的互动次数多少,分析其投资意愿程度大小。投资人发言和与创业者之间互动的次数多少,反应了投资人对这个项目的关注程度。越是对项目感兴趣的投资人,越会更多询问创业者项目信息,以便挖掘项目发展潜力。

4 应用实例分析

从央视创业投资节目2019年8月改版以来,虚拟主持机器人(小创哥)已经参与了24期节目的录制。没有出现因为机器人的问题而影响节目录制的情况发生。在保证主持互动中问题回答准确率的同时,小创哥的回复速度也随着系统的不断优化逐渐改善,实际应用案例分析如下。

4.1 推荐系统应用实例

在创业节目录制现场中,“智能投顾算法”将根据项目领域、投资金额、现场交流情况进行“投资匹配度”计算,给创业者提供选择合理投资人的建议。表3为某期投资人推荐系统计算结果。

表3中,第一列为在场的8位投资人姓名,第二列为8位投资人与创业者项目领域匹配得分,第三列为投资人出资金额匹配得分,其中0.00分表示投资人未出价,第四列为节目现场创投双方交流情况匹配得分,最后一列为综合匹配得分。

表3 投资人推荐系统计算结果

由表的最后一列可以看到,最终系统既没有推荐选择领域匹配度最高的6号和7号投资人,也没有推荐出资金额匹配度最高的8投资人,以及交流匹配度最高的4号投资人,而是综合了三项因素选择了1号投资人,这期创业者最终听从了小创哥的建议选择1号投资人作为自己的创业投资人。

电视节目实际播出效果如图6所示。当主持人或创业者咨询机器人时,小创哥将在大屏幕上播报推荐结果:“通过人工智能计算,小创哥推荐的这位投资人,他的投资领域匹配度是0.87,现场交流匹配度是0.75,投资金额匹配度是0.83,综合匹配度是0.83,投资人匹配度最高的是1号投资人”。

图6 电视节目播出效果图

4.2 推荐算法合理性分析

针对投资人推荐系统,统计在24期节目共73个创业项目中,有40位创业者主动希望听取小创哥给出的建议,另有6位创业者在主持人的建议下咨询了小创哥的意见。在46次投资推荐应用中,有6次小创哥给出的投资人选择建议不是节目现场出价最高的投资人,在这6次中有5次创业者听从了小创哥的建议,并且小创哥的分析多次得到了不同创业导师的肯定,说明了小创哥推荐的合理性,推荐采纳率为97.83%(45/46)。

对于其中1次创业者没有选择小创哥推荐的投资人,咨询其原因主要是考虑“所选择的投资人所在地域能够提供更大的市场资源,能够快速帮助项目产生销售额”,从这个意义上讲,在推荐模型中还可以进一步考虑“地域、市场”维度,今后可以进一步改进完善。

5 结论

介绍了人工智能虚拟辅助主持机器人的实现方法,通过在央视节目中的成功应用证明了方法的有效性。人工智能和机器人技术正在各行各业中普及应用,电视节目也不例外。本文设计并实现了虚拟智能主持机器人系统,建立了智能投顾算法模型,实现了节目主持过程中的智能问答与投资推荐功能,是人工智能机器人技术在电视节目中的创新应用,对促进影视传媒行业的智能化发展具有重要意义。

猜你喜欢
提取阅读理解
现场勘查中物证的提取及应用
土壤样品中农药残留前处理方法的研究进展
中学生开展DNA“细”提取的实践初探
微课在英语阅读教学中的导学探究
浅析城市老街巷景观本土设计元素的提取与置换
刍议英语阅读理解讲评课
虾蛄壳中甲壳素的提取工艺探究
环保新型缓蚀剂发展状况与展望