王向强,黄 俊,张作运
(重庆邮电大学 信号与信息处理重庆市重点实验室,重庆 400065)
基于Kinect虚拟文物互动展示系统的设计与实现
王向强,黄 俊,张作运
(重庆邮电大学 信号与信息处理重庆市重点实验室,重庆 400065)
利用Kinect的局部骨骼追踪技术,捕获人体数据、彩色数据和深度数据,对采集到的数据进行分析,描绘出手的轮廓并且根据深度信息识别出手势的意思,做逻辑处理后,通过Kinect设备将信息发送给PC,形成操作命令映射到虚拟文物上,虚拟文物会进行相应的动作,比如移动、放大、旋转等。测试结果表明,系统工作稳定可靠,体验者能够通过体感交互技术较好地对虚拟文物进行控制。虚拟文物互动展示系统突破了传统文物的展示方式,使观众积极参与到展览之中。
Kinect;骨骼跟踪;手势识别
2008年,比尔盖茨提出“自然用户界面”的概念,并预言人机交互在未来几年内会有很大的改变,键盘和鼠标将会逐步被更为自然的触摸式、视觉性以及语音控制界面所代替。Kinect是一个动作捕捉设备,Kinect和用户的结合就形成了一套完整的控制系统。
目前我国很多博物馆所建立的虚拟博物馆大多数是使用VRML语言进行建模,借助于WRL文件浏览器插件基于IE进行浏览,这样用户可以方便快捷地浏览。但是VRML是基于浏览器的一种脚本语言,对于相应事件的处理能力有限,与用户的交互能力较差,并且也无法与数据库连接,在构建虚拟展馆过程中需要手动添加文物模型[1]。
针对以上问题,本文所设计的虚拟文物互动展示系统使用MySQL数据库存储文物的详细信息;使用FTP服务器来存储3D模型文件,并由系统自行获取;使用Kinect手势识别技术,让用户与文物模型隔空交互,从而有效地解决了交互能力差的问题。本文还提出了K-Means算法来有效地解决手型图标的抖动问题。
可以想象到,在一个博物馆里,观众只需要用手势去触碰虚拟的按钮,就可以选择你感兴趣的文物,只需要变换手势,就可以对文物进行移动、放大、旋转。虚拟文物与参观者互动的方式,让展览更具感染力。
基于Kinect虚拟文物互动展示系统的结构主要由显示模块、文物控制模块、UI交互模块、文物存储模块以及动作捕捉与识别模块构成,各模块之间协同合作,构成了具有完备功能的虚拟文物展示系统,如图1所示。
图1 系统结构图
(1)显示模块:负责获取场景中的用户影像,并将虚拟文物模型与用户影像进行融合并显示。
(2)文物控制模块:负责对虚拟文物模型的位置、大小和角度进行调整,并且接收动作捕捉与识别模块发过来的控制信息,做出相应的变动。
(3)UI交互模块:负责获取界面控件的位置,并且比对用户手的位置,进行对应的响应。
(4)手势捕捉与识别模块:负责捕捉到用户手的关键点,并且获取手的深度信息,然后对信息进行处理,识别出用户手势的意思,并发送指令给文物控制模块。
(5)文物存储模块:该系统包括MySQL数据库以及FTP服务器。虚拟文物的编号、朝代以及其他详细信息数据会存储到MySQL数据库中。因为虚拟文物模型所占空间比较大,所以把模型放在FTP服务器中,由该软件直接调用。
基于Kinect的虚拟文物互动展示系统的结构化设计,提高了系统的灵活性,降低了模块之间的耦合性,不同模块之间通过接口进行通信,使得各个模块能够独立高效地完成各自功能。
Kinect体感设备主要是由彩色摄像头、深度摄像头和红外线投影机组成。Kinect设备与普通摄像头的区别在于红外线发射和红外线接收功能,通过这个功能,Kinect可以获取场景的深度信息。Kinect的基本原理是:红外投影机主动投射红外光谱,照射到粗糙物体,或是穿透毛玻璃后,光谱发生扭曲,会形成随机的反射斑点,也就是散斑,进而被红外摄像头读取。这些散斑就有高度随机性,并且随着距离的变化,散斑也随着改变,在同一空间中不同的散斑图案都不相同[2]。因此,只要使用散斑对空间编码,当有物体进入空间时,即可定位。
虚拟文物互动展示平台软件采用WPF进行开发。WPF是微软推出的Windows Vista的用户界面框架。它提供了统一的编程模型、语言和框架,真正做到了分离界面设计人员与开发人员的工作,同时它提供了全新的多媒体交互用户图形界面。WPF最重要的特色是支持3D模型,以及支持模型的点击事件。整个虚拟文物展示系统软件设计运用Kinect体感设备和WPF框架等技术手段,包括手势识别、UI交互、文物展示以及文物存储的智能交互展示系统,对虚拟文物展示实现了主动选择、交互体验良好、操作方便的目标。虚拟文物互动展示的主要功能模块如图2所示。
图2 虚拟文物控制平台的主要模块功能
3.1 GUI设计
在主界面上包括四个不同功能的悬浮按钮,这四个悬浮按钮是根据人体的合理肢体操作距离而设计的。这四个悬浮按钮的功能分别为虚拟文物展示、虚拟文物详情、博物馆视频简介以及退出。在本项目设计中,最重要的是虚拟文物展示功能。当用户选择虚拟文物展示悬浮按钮时,该软件会弹出另一个窗口,用户可以根据自己的兴趣爱好,选择不同朝代的文物来进行控制,比如根据不同的手势来移动、放大以及缩小和旋转文物。
3.2 悬浮按钮
悬浮按钮控制流程如图3所示。悬浮按钮其实是一个普通的控件,有三种状态分别为经过、按下和离开,可以有效地解决不小心点击的问题[3]。通过Kinect SDK首先识别出用户举起的是左手还是右手,再获取左手或者右手的三维坐标数据,然后激活界面的一张手型图标,通过坐标映射的方法,把手的三维坐标转换成二维坐标,转换过的二维坐标映射到手型图标上,这样界面上的手型图标会随着用户的手在界面上移动。当用户的手型图标没有接触到该悬浮按钮的时候,它没有任何变化。当手型图标移动到按钮区域时,手型图标周围会出现进度条控件,当时间超过2 s后,会触发悬浮按钮OnClick事件,当手型图标不在按钮区域时,悬浮按钮恢复初始状态。
图3 悬浮按钮操作流程图
3.3 解决手型图标抖动问题
图4 二维坐标点群
Kinect每秒钟会采集30帧的深度/RGB数据,每帧所获取的骨骼的三维坐标都是不相同的,转变成二维坐标也是不相同的,所以把二维坐标映射到手型图标上,手型图标会出现抖动的情况。在软件编程中,取出30帧的二维坐标数据如图4所示。
本文的设计考虑到抖动这一问题,提出采用K-Means算法[4]的解决方案,其基本方法为:首先在软件中提取出最近的6个帧的骨骼三维数据,然后转换成二维坐标数据。再使用K-Means算法,随机在图中取K个种子点,然后对所有点求出到其K个种子点的距离,假如点pi离种子点最近,那么pi属于si点群。接下来,把种子点移动到属于它的点群中心。然后重复上述步骤,直到种子点没有移动。最后使用各个点的X/Y坐标的平均值,计算出点群中心的坐标。把6帧二维坐标的点群中心坐标映射到手型图标上可以有效地解决抖动的问题。具体算法流程如图5所示。
图5 K-Means算法流程图
3.4 文物选择与控制
该系统首先根据客户的需求,对用户的手势行为做了规范协议[5],如表1、表2所示。如果用户的手势不是协议中所规定的,系统将不会做出任何响应。
表1 文物操作协议
表2 用户照相协议
图6 文物操作流程图
用户操作虚拟文物的流程如图6所示。用户可以用自己的左右手来选择查看哪个朝代的文物,只需要把手放在图标按钮2 s即可。当用户选择了清朝的文物,界面右边会出现文物的二维图片,用户可以继续选择具体的文物。当用户选择了一个自己比较感兴趣的文物时,界面会出现一个3D文物模型,用户可以根据手势协议来操作模型,例如对模型旋转、放大等。当用户想查看其他的文物时,只需要把当前文物撤销即可。用户想要和当前文物模型合影时,只需要把手放在照相按钮上,系统会把图片保存到文件夹上。
为了验证系统的可靠性以及响应时间,进行了如下的现场测试。测试环境为Win10+WPF+Kinect for Windows SDK 1.8。测试者站在Kinect正前方,做出不同的手势,以验证不同手势识别的准确性。
表3为测试者做出不同手势的结果。
表3 实验结果
实验结果表明,使用Kinect能够正确判断出用户手势的意思,通过相应的算法以及手型图标抖动问题的解决,进而实现了对虚拟文物的位置、角度、姿态的控制,充分验证了基于Kinect的虚拟文物互动展示系统的可行性。
基于Kinect的虚拟文物互动展示系统是一个新颖而又充满意义的课题。本文使用Kinect与WPF完成了一套用户体验良好、功能完备的用户与虚拟文物互动系统。该系统主要通过Kinect 来获取人体骨骼坐标数据,通过对数据的分析与综合识别出用户的肢体语言,然后映射到3D文物上,实现用户与3D文物之间的互动。本文还提出了使用K-Means算法来解决手型图标在屏幕上的抖动问题,使用户具有更好的体验。下一步研究方向是采用手机App和Unity3D的开发方式,如通过扫描文物图片,在手机屏幕上出现3D文物模型,用户通过触屏的方式与3D文物进行互动。这样可以有效地解决用户多的问题,让每位用户都可以积极参与到博物馆展览之中。
[1] 刘鹏飞 虚拟博物馆系统的设计与实现[D].长春:吉林大学,2011.
[2] 马源驵.基于Kinect的内容展示系统设计与实现[D].郑州: 郑州大学,2014.
[3] 韩娜,陈东伟,钟单成,等. 基于Kinect的虚拟试衣系统设计与实现[J].信息技术,2015(7):59-61.
[4] 陈皓.K-均值算法[DB/OL].(2013-11-28)[2016-08-25]http://blog.jobbole.com/23157/.
[5] 胡焰.基于Kinect 的虚拟试衣系统的设计与实现[D].武汉:华中科技大学,2013.
王向强(1989-),硕士研究生,主要研究方向:物联网关键技术、嵌入式技术、虚拟与增强现实技术。
黄俊(1971-),教授,主要研究方向:物联网关键技术、无线通信网络、光通信网络、嵌入式技术等。
张作运(1990-),硕士研究生,主要研究方向:物联网关键技术和嵌入式技术。
Design and implementation of virtual interactive display system based on Kinect
Wang Xiangqiang, Huang Jun, Zhang Zuoyun
(Chongqing Key Laboratory of Signal and Information Processing (CQKLS&IP), Chongqing University of Posts and Telecommunications (CQUPT), Chongqing 400065, China)
In this paper, Kinect’s local skeletal tracking technique is used to capture the human body data, color data and depth data.Then,the system analyzes the collected data, depicts the outline of the hand and recognizes the meaning of the gesture according to the depth information. After logical processing,information is sent to the PC, the formation of operational commands is mapped to virtual relics.Virtual artifacts will do the appropriate action, such as mobile, zoom, rotation and so on. The test results show that the system works stably and reliably, and the experimenter can control the virtual relics better through somatosensory interaction technology. Virtual cultural relics interactive display system broke through the traditional artifacts display mode, so that the audience to actively participate in the exhibition.
Kinect;skeletal tracking;gesture recognition
TP391
A
10.19358/j.issn.1674- 7720.2017.02.014
王向强,黄俊,张作运.基于Kinect虚拟文物互动展示系统的设计与实现[J].微型机与应用,2017,36(2):41-43,47.
2016-08-25)