智能调度平台中的人工智能技术研究

2023-10-30 02:28沙永兵肖丰明曹德勤余伟刘小军
中国信息化 2023年9期
关键词:人脸识别指令语音

沙永兵 肖丰明 曹德勤 余伟 刘小军

为满足集控中心和调控电厂发展需求,保证电厂生产的安全性,现设计一款功能完善、实用性强的智能调度平台。在该平台中,主要用到以下四种关键技术,分别是人脸识别、语音智控、智能机器人和智能告警。本文结合智能调度平台,重点研究和实现该平台四大人工智能技术。希望通过这次研究,为相关人员提供有效的借鉴和参考。

通过运用人脸识别、语音智控、智能机器人和智能告警等多种人工智能技术,完成对智能调度平台的设计,不仅可以实现集控中心现有生产模式的改革和创新,还能促使电力调度过程管理变得更加智能化、高效化,有效地提高调控电场运维操作的可靠性和安全性,促使智能调度平台能够正常、稳定、安全地运行。在设计智能调度平台期间,加强对以上几种人工智能技术的研究显得尤为重要。

采集终端设备包括平板、PC所收录的语音数据上传至声纹库,再根据提取的说话人声音特征和说话内容信息,对比声纹库自动核验说话人身份,达到精准的声纹识别要求。基于已获授权输入的图片中人像破绽及成像畸形,可有效识别目标是否为活体,并给出置信度参考,通过提取两张人脸的特征进行相似度对比,最终返回相应的置信度得分,系统根据特征匹配程度决定“拒绝”或者“接受”。用于判断两个输入人脸是否属于同一人,用于系统身份识别登录及指令发布权限的核实。提供服务调用接口,提供声纹识别和人脸识别标准调用接口,给需要调用的系统调用。

(一)客户端设计

通过运用客户端,可以采集用户或录音语音输入发送到服务端进行转写和语义解析,同时根据语义解析结果执行指令,控制终端设备显示和语音播报。客户端支持Windows和Android操作系统,支持PC、数字大屏、一体机、机器人等终端设备。客户端设计采用如下方式进行:

通过自然语言交互方式实现常用对应用软件的操控,如PPT、Word等文件的打开,并其内容展示进行操控。如:用户说“打开讯飞语音智控系统白皮书,详细版”,接着用户可以通过语音进行上下翻页,或者跳转到第N页,甚至用户可以说“帮我打开系统架构”,该Word文件即会自动跳转到该页。

通过语音控制音视频文件播放,用户说“音频播放”,会听到“请选择您要播放的音频”,同时看到可供选择的音频列表,通过语音交互方式选择即可播放。视频播放支持同样交互方式。用户也可以直接说出“播放展馆介绍”,即可播放对应音频或者视频。

(二)服务端设计

智控内容即智控方案管理。针对不同的智控对象可设置不同智控方案。

(1)网页智控方案。通过运用该方案,对Web应用系统进行演示操作。具体操作步骤如下:首先,直接配置网页操控指令,即接收并识别用户语音后执行的操控指令,如页面跳转、按钮点击等操作。其次,配置录音播报场景,既针对某个业务场景,实现全自动化演示与操作,无需人工参与:上传真人录音或者录入讲解内容合成录音,在客户端语音控制播放该录音,系统即可识别、解析并执行录音中相关操控指令,充分释放人力。

(2)软件智控方案。软件智控方案主要是指应用软件内容操控,如打开PPT、Word等文件,对PPT、Word文件进行上下翻页、跳转到指定页(如用户说“回到第8页”)、调转到指定内容页(如用户说“打开系统架构”),其中上下翻页、跳转到指定页指令在“通用指令管理”中已配置,这里无需重复配置。

在设计智能调度平台时,重点应用智能机器人技术,通过应用该技术,可以完成对智能服务器机器人的设计,该机器人主要由主控板、工控机、底盘控制板、IMU、激光扫描仪、华为TD-无线数据终端、语音识别模块、表情显示器、业务办理显示器、人脸识别模块、3D摄像头、手臂控制板、手指控制等模块组成。

该机器人主要包含以下功能。(1)行走播报。支持设定特定时间端,按照既定路线行走,当遇到人员时,会提醒让行,机器人可以一边行走,一边播报预定内容,同时支持智能打断播报内容。(2)定点讲解。语音或者屏幕触发机器人按照既定路线或者单点讲解,到达指定地点,播放既定内容(语音/图片/视频),可设计机器人在指定地点等待时长。同时可以让机器人做相关动作(按照系统内置动作组选择)。(3)定制对话。本地无限量QA对话输入,可以满足对话内容轻松录入和编辑,快速响应;支持通过语音输入控制大屏数据页面切换,页面切换顺滑,数据能够联动刷新。(4)远程监控。Android手机或者PAD端可以通过网络远程监控,通过机器人头部摄像头到现场情况进行监控巡逻。(5)自动充电。机器人可根据指令或者电量情况,自行充电。(6)人脸识别。支持2000人本地人脸识别,本地录入人脸,编辑识别后,问候内容。在待机界面中,只要录入人脸人员经过就可以主动问候。(7)主动迎宾。设置机器人欢迎词,当机器人待机状态,只要有人进入1.5米内,就会迎宾问候,同步也有人脸识别打开,按设置内容主动问候。问候结束弹出对话框交流。(8)编程。Android手机或者PAD端可以编程控制机器人做动作、表情、视频和语音,起到表演的作用。

在设计智能调度平台时,通过应用智能告警技术,可以将语音助手、应急平台故障分析和话务系统深度集成,保证平台多样化告警提醒功能实现效果。该平台具体设计步骤如下:

(1)智能话务平台对接报警分级系统。智慧告警平台提供接口,可以实时接收水电系统发送的故障信息,故障信息包括故障类型、故障时间、故障内容等信息。智慧告警平台与报警分级系统通过接口进行对接,智慧告警平台接收到告警信息后,可以根据故障信息从数据库中检索关联的人员列表,如果检索失败或者未设置关联人员,则可以关联系统设置的紧急处理人员。

(2)对接语音合成引擎。智慧告警平台将文本告警信息通调用语音合成引擎转换成语音,通过智能话务平台拨打给告警处理人员并进行告警信息播报。

(3)对接实体机器人或者现场播音设备,实现告警内容播报。智慧告警平台在接收到告警信息时调用语音合成引擎,通过实体机器人或现场播音设备,将预警内容合成语音信息进行播报。

(4)当发生故障时,系统自动识别当前故障关联的人员,获取人员电话号码,并打通相关人员调度电话,对告警信息进行播报。

在人工智能技术的应用背景下,为促使智能调度平台向智能化、高效化、数字化方向不断发展,技术人员要重视对人脸识别、语音智控、智能机器人和智能告警四大关键技术的运用,通过运用以上技术,不仅可以保证调度指挥的智能性和便捷性,还能提高调控电厂生产的安全性和可靠性,为确保智能调度平台在集控模式下能够稳定、高效地运行提供重要的技术支持。

作者单位:五凌电力有限公司

猜你喜欢
人脸识别指令语音
听我指令:大催眠术
人脸识别 等
揭开人脸识别的神秘面纱
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
ARINC661显控指令快速验证方法
对方正在输入……
LED照明产品欧盟ErP指令要求解读
基于类独立核稀疏表示的鲁棒人脸识别