王 曦,曾广平,乔 柱
(北京科技大学 计算机与通信工程学院,北京 100083)
心理健康越来越成为一个重要的社会关注热点和国家文明进步的重要内容,而且采用新一代信息技术如何为心理健康提供科技支撑,是我们研究一个重要方向。正因为这种科学意义,本文选择面向心理健康服务,研究机器人的方法和技术,力图为心理健康服务提供智能化的数字化辅助工具和手段。
服务机器人领域现在依然存在许多尚未完全解决的科学问题,同样也涉及非常多的关键技术。比如:
1)具有过渡过程的多执行器的情感控制模式研究;
2)心理健康服务产生的图灵测试方法,做一个服务机器人,试看哪位心理咨询考试员谁能通过她的考试;
3)具有专业知识教育的情感服务机器人(教师,医生,心理咨询师)智能对话库内容研究(1、直接匹配对话库;2、数据库形式化之后,用机器学习、知识图谱等建立对话模式);
4)体现人工智能与人工心理健康服务的方法和技术水平。
这些都是服务机器人的重要研究方向,需要不断地对其进行研究。
本文面向心理健康服务,研发一种具有表情、语音交互、内容数据库等功能的智能机器人。分析了服务机器人的头部运动系统的基本结构,对如何通过控制基本参数来产生表情的原理进行了研究;提出了将人工心理与情感计算等领域的方法应用到心理健康服务之中的想法;并提出了一种心理健康服务计算的心理咨询辅助推理模型。建立一种面向心理健康服务的机器人辅助系统,希望可以为心理咨询师及其相关人员提供智能辅助。
机器人基本动作:
动作表情功能(12个舵机、14个自由度)。
低头(前屈)、抬头(后伸)。
前屈、后伸最大活动度如图5所示。
左扭头(左旋)、右扭头(右旋)。
左旋、右旋最大活动度如图6所示。
左右摆头:摆动幅度为左右±25°。
张嘴动作:颌关节最大张开度25°。
眨眼动作:左右眼睑独立控制,可同时眨眼,也可单独眨眼。
眼球左右转动:双眼球联动,左右转动幅度为±20°。
眼球上下转动:双眼球联动,上下转动幅度为±20°。
微笑:左右侧笑单独控制,嘴角后拉最大幅度大约5mm。
眉毛上下挑眉,左右眉单独控制,上挑最大幅度大约5mm。
眉毛向心皱眉,左右眉单独控制,向心最大幅度大约5mm。
我们将下述的多种技术集成到心理健康服务机器人系统中。外形是一个人型机器人,内嵌心理筛查和心理干预数据库和知识库,面向实际应用,研究验证心理健康服务计算研究的有效性和实用性。
围绕心理健康和物联网教育,我们搜集开源数据库并建立自己的数据库把心理咨询、老年生活照料作为对话服务主体内容。建立一个面向健康生活服务的对话机器人助理。
目前,心理健康服务对话数据库的建立主要分为:医学、心理服务、日常对话。现在已有10000多条对话条目,而且还可以增加。
医药类:主要包括该疾病的定义、病因、症状、治疗、后遗症、并发症、护理与饮食,其中:脑梗死 19条数据,高血压 16条数据,新冠肺炎 15条数据,上呼吸道感染 23条数据,糖尿病 18条数据等。
心理类:心理知识类308条数据;心理咨询的基本问题对话库 257条数据;
日常对话类:日常对话 9600条数据。
我们的数据库里,还有10000多家全国养老院数据,以便于查询各地的养老服务信息。
基于电机运动的控制指令,组合生成复杂、复合的机器人表情动作,是表情机器人的基本研究问题。
在如何理解人类的面部表情的设计方面,本文根据人体解剖学的理论知识来理解人类面部的组织结构,并学习了组织结构各个部分的具体功能,以及每个部分具体如何实现表情的原理。同时,通过学习人脸表情的面部运动编码系统(FACS)的相关定义来进行机器人面部表情的设计和理解,获得了每个运动单元和肌肉之间存在的对应关系。使用上述理论所获得的机器人表情设计方案,使用机器人表情控制编辑软件来进行实现机器人表情的最终实现,其编辑软件界面如图1所示。
图1 机器人表情控制编辑界面
心理健康服务对话机器人以心理咨询学习训练为应用对象,需要建立对话的智能决策模型,以期望真正能够做出心理咨询机器人辅助系统。
1.5.1 心理健康服务计算的心理咨询辅助推理模型
这里首先考虑心理咨询理论在心理健康服务计算中的指导作用,建立一种心理健康服务计算的心理咨询辅助推理模型。如图2所示。
图2 心理健康服务计算的心理咨询辅助推理模型
模型推理过程如下:输入来访者的数据(语言、行为、参数、图像、视频等等),采用图像处理技术和数据分析等技术提取特征,再根据相关心理咨询理论使用机器学习算法得到分类结果;输出为根据前述方法获得的来访者内在心理状态模型的评估和预测,并以各种展示技术呈现给心理咨询师和来访者,进而起到辅助心理咨询过程的作用。
1.5.2 建立一种面向心理咨询的辅助应用系统
这里主要是应用人工心理逆问题研究的理论方法,进行具体实现。
将来访者的数据(语言、行为、参数、图像、视频等)通过使用自然语言理解、计算机视觉技术和情境感知计算等技术提取特征,再根据相关心理咨询理论使用机器学习算法得到分类结果;进而得到心理咨询来访者的心理评估,推荐给心理咨询师,辅助其分析来访者的心理状态,提高心理咨询的准确度和效率。
技术路线:首先建立一个人的心理状态结构—分析数据-推理计算—得到精准心理问题状态—缩短心理咨询过程。目的在于建立一种面向心理咨询的人工心理辅助应用系统,为心理咨询师及其相关人员提供专家辅助系统,进而验证本研究的有效性和正确性。
心理咨询机器人不仅仅有动作交互,还需要智能化的语音交互,以及后台计算和数据的支持,是一个整体的系统服务。将机器人讲话内容+对应语音+相应表情有机融合,研究机器人的表情控制模式,建立一种丰富的机器人控制指令库,实现和谐人际交互模式,是我们的研究目标。
2.1.1 主要功能描述
1)智能语音交互功能
智能语音交互功能,可以实现用户和虚拟小人的聊天对话。包括闲聊,问答,百科,生活常识,数学计算,等多个数据库,可以满足大多数人的沟通上的需要。并且通过建立知识库,能够进行一问多答,多问一答,实现智能化交互。
2)智能语音服务功能
智能语音服务功能通过语音接口来为用户提供以下相关服务:可以为用户查询任意城市最近5天的天气和空气质量;也可以设置定时提醒,准时自动提醒用户要做什么事;它也能够查询一些常见疾病的相关知识,进而给老年人提出一些身体健康的知识普及和保健指导;也能帮助用户查询全国各地的养老院或养老相关服务机构的信息。本工作拥有独一无二的全国养老院以及各类老年人服务中心的数据库。这是由本项目组的几位研究生通过一年的工作搜集并建立起来的,包含了几十万条详细的信息。
2.1.2 安卓开发
Eclipse安卓开发环境下,开发配套APP,集视频播放,语音识别,语义理解,语音合成,语音唤醒,人脸检测于一体,并能通过WiFi模块与各种硬件功能模块进行通信,实现语音交互和控制。还要与云端服务器进行数据交换,利用云计算和大数据实现智能化的语音交互。
视频播放功能则使用安卓自带控件。
语音识别等技术,应用科大讯飞平台的离线SDK和在线API,将各个语音功能模块整合在一起,在逻辑上符合用户语音交互需求,性能上健壮稳定。
人脸识别技术现已成熟,本文所做工作应用了face++人脸识别平台来进行视频流的人脸检测并将其集成在APP中。
机器人软件控制流程图如图3所示。
图3 机器人软件控制流程图
机器人硬件构成如图4所示。
图4 机器人硬件构成图
心理咨询机器人内置安卓操作系统,内部集成有APP,可以进行语音交互,人脸识别。红外传感器则是,当检测到用户的接近时,通过WiFi通信对安卓主机进行唤醒。智能家居遥控模块其实就是通过WiFi和APP进行通信,实现智能控制的交互功能,即人们可以用语音与机器人交互,控制电灯开关、电视开关等功能。
这里的心理咨询对话库,主要是将机器人当做是人类心理咨询师的助手,通过对话,机器人对来访者进行基本情况收集、初步的心理状态进行评估,进而为心理咨询的判断提供客观依据,可以大大缩短心理评估的进程。
图5所示为我们的心理健康服务机器人外形图。
图5 机器人外形图
图6所示为心理健康服务机器人对话的程序调试界面。
图6 心理健康服务机器人对话界面
实验表明,由于充分利用了实物机器人技术的真实感和亲切感的优点,应用于心理咨询和老年人的服务。并结合了语音技术,智能家居服务技术等,使交互更加人性化,大大加强了机器人服务性,机器人功能更加丰富。
本文面向心理健康服务,研发实现了一种具有表情、语音交互、内容数据库等功能的智能机器人。为该智能服务机器人能够产生表情功能而研发了面部表情的控制系统;分析了机器人的头部运动系统结构及其产生表情的结构性原理;首次提出了将人工心理与情感计算等领域的方法应用到心理健康服务之中的想法;并提出了一种心理健康服务计算的心理咨询辅助推理模型。建立了一种面向心理健康服务应用的智能辅助系统,可以为心理咨询师及其相关人员提供智能辅助。这在国内目前的心理咨询应用领域还未见类似研究。开发的智能机器人为心理健康服务增加了新的数字化辅助工具和手段。