人工智能视域下协同过滤推荐系统的工程训练平台

2019-05-20 11:05许晓飞陈雯柏
实验技术与管理 2019年4期
关键词:人脸人脸识别协同

许晓飞, 米 洁, 陈雯柏

(1. 北京信息科技大学 自动化学院, 北京 100192; 2. 北京信息科技大学 教务处, 北京 100192)

人工智能(AI)技术快速发展对人类社会的各行业都引起了深远广泛的影响,如在深度神经网络的广泛应用、脑科学研究的不断进步与突破,在大数据、云计算等相关技术的支撑下,人工智能技术被快速地应用到农业、医疗、教育、能源、国防等诸多领域。许多国家都制定针对性的国家人工智能研发战略规划,社会急剧增加的人才需求倒逼人工智能类专业人才培养教育模式必须改变。北京大学贾积有教授认为人工智能教育是在以计算机为代表的人造机器上实现的人类教育[1]。面对人工智能重要挑战,作为人工智能类专业的教育工作者创造特定机器实现智能教育平台,并在此之上开展创新实践教学工作符合人工智能科学技术发展规律,将强化人工智能方面的人才培养[2-4]。

本文深度总结十几年来我校智能科学与技术专业建设经验[5],主动解析提升人工智能类的本科教育人才培养内涵、关键技术及应用趋势等,提出以构建人工智能视域下典型内核算法应用的协同过滤推荐系统为工程综合创新实践教学平台[6],针对学生学习智能专业课程中存在对复杂工程抽象理论理解困境,以及编写应用智能算法的畏难情绪,进行教学实践项目阶梯式的设计,使教师和学生可以从单一、繁重的机械性劳动中“解放”出来,把注意的中心放到创造性工作上去;智能系统的后台推荐部分以及深度学习都比较抽象,却是重要且偏重实际应用的算法,涉及编程语言平台及运行环境也较多,学生学习较为困难; 而通过增加采用摄像头实时获取样本数据的视觉部分、结合简易机械臂移动部分,基于分拣物品的图片或用户脸部信息识别的智能数据推荐系统设计,这样一体化平台可以帮助学生直观获取到深度学习算法应用的过程及结果,从而实现在教学过程中能致力于培养学生的创新意识、创新能力及实践能力[7]。

1 人工智能视域下工程型人才培养

人工智能的快速发展作为人工智能工程类本科生培养方案中,涉及专业课程内容如知识的表示方法、机器学习与深度学习、自然语言处理、智能代理、情感计算等方面,其应用与发展趋势集中在智能导师与助手、智能测评、学习伙伴、数据挖掘与学习分析等领域[4],这些专业课程要求能够融会贯通的关键技术内容简介如下:

(1) 知识表示方法。作为人工智能和信息融合的核心技术之一的知识表示,有早期的一阶谓词逻辑表示法、产生式表示法、框架表示法以及现在的神经网络知识表示法等。

(2) 机器学习与深度学习。作为人工智能研究的一个核心领域的机器学习,在1997年Tom M. Mitchell在《Machine 2 Learning》中提出机器学习理论的经典定义,“计算机可以有通过学习从而不断进化的行为”; 如深度学习通过建立类似于人脑的分层模型结构,输入数据逐级提取从底层到高层的特征,对应构建起从底层信号与高层语义间的映射。

(3) 自然语言处理。自然语言处理主要是让计算机理解人类的自然语言,以实现用自然语言与计算机进行交流,如自然语言、机器语言和文本生成之间的翻译及转换。

(4) 情感计算。情感计算是指人类通过为机器设定程序使之能识别、理解、处理并模拟人的情感。例如,可运用摄像机捕捉面部表情和手势,采用情感算法计算,进而使机器获取捕捉到的用户情感状态。

本文提出的协同过滤推荐系统,将人工智能类新工科教育以模拟解决以上几大类复杂工程问题为载体,转化为系统化的大量样本数据的实时采集输入,智能算法的协同过滤推荐,以及能直观观测的人机交互式结果输出,具有综合实践的教学过程可操作化。

2 协同过滤推荐系统

推荐系统是一种信息过滤系统,根据用户的历史记录,实现实时、快速地对用户的行为进行分析,找到其可能感兴趣的视频,为用户进行推荐。日常生活中能接触到的大量互联网产品都大量使用了推荐系统,如一些比较知名电商网站等。推荐系统的工作流程示意图如图1所示[8-12]。

图1所示的协同过滤推荐系统符合“复杂工程问题”特征。协同攻关5大模块:数据收集模块,推荐引擎模块,数据存储模块,用户交互模块以及推荐结果处理模块。一个教学小项目可以是:对于推荐系统的原理及其如何利用用户轨迹数据进行分析研究。比如分析经典基于用户/基于物品的协同过滤推荐算法:(1)基于用户的协同过滤算法主要思想:给定一个评分矩阵和一个准备为之推荐物品的用户,根据评分矩阵结果找到与这个用户相似度最接近的多个用户,然后从多个用户中选择该用户不曾购买过的商品推荐给他;(2)基于物品的协同过滤系统不是匹配需求者间的关系,是计算出与用户感兴趣的商品相似度较高的商品,这里将针对对象从需求者变成商品,然后把那些相似的物品组合成一个推荐清单。

图1 协同过滤推荐平台工作流程示意图

并将两者进行深度研究对比,学生能够选择一种算法对推荐系统进行设计,整个小项目完成的过程中,培养学生解决不确定问题能力和创新综合思维。

3 以用户脸部信息推荐为例的工程综合与创新实践教学平台

用户脸部信息推荐系统的软件部分涉及到人工智能技术的典型方面,如知识的表示方法、机器学习与深度学习、自然语言处理、情感计算等方面交叉融合功能模块[13-18]。

3.1 用户脸部信息特征创新实践训练方案

举例:简单工程训练目标任务,将人脸识别与推荐系统相结合,使用CNN卷积神经网络,基于python和caffe实现对用户面部特征的识别和分析,得出用户的年龄段与性别等,根据所得结果对用户进行分类。根据返回的用户分类结果,推荐系统选择相应的商品为用户进行推荐[19]。

完成人脸识别有4个核心步骤,分别是采集图像、检测图像中人脸位置、对图像进行预处理和提取、匹配图中人脸的特征并识别。

采集图像:在采集人脸图像时可以通过改变采集位置、改变面部表情、静态和动态等方式来获取不同图像。学生可以搭建出主动寻找出现在拍摄范围内的用户,并获取面部图像的视觉获取设备,如全方位搜索移动的机械臂上安装摄像头。

图像人脸的定位位置:实际应用中的人脸检测主要负责完成人脸在图像中的位置和大小的确认。图像中的人脸包含颜色、结构、直方图等非常多的特征,在检测人脸时将从利用这些特征中提取出的相关信息来完成人脸检测。

图像的预处理:预处理操作位于对图像中人脸的检测步骤之后,基于上一步检测出的结果以适当的预处理方法处理图像,去除图像中的干扰因素,包括调整图片明暗、校正图片灰度、完成噪声滤波、图像锐化、灰度变换和数值归一化等,为提取人脸特征做好铺垫。由于拍摄图像时各种人为和环境条件的限制和干扰,直接获得的原始图像不经过处理无法在系统中直接使用。

提取图像中人脸特征与建模:在匹配与识别人脸的过程中常用的四种特征有图像的直接视觉特征、像素特征、变换参数及其数学特征。提取人脸特征的主要方法可以分成以下两种:一种是基于已有知识对图像中的人脸特征信息进行提取,另一种则是源于数学特征的统计和学习。

基于已有知识的特征提取方法主要包括分析人脸结构的几何特征和将人脸与模板作对比获取特征。主要是通过收集人脸上各种器官的形状信息和各个器官之间的距离信息来收集匹配与识别人脸时所需要的人脸几何特征信息。通常用提取出的每个特征点之间的距离、曲率和角度等几何分量代表这些特征。

匹配图像中的人脸并识别:将上一步从图像中获取出的人脸特征数据与预先制作完成的样例进行对比,通过匹配结果判断图中是否为人脸,该人脸是否是数据库中登录过的某人。从图像中获取的需要识别的面部特征与已有样例的特征进行匹配,并依据这些特征的相似程度来判断人脸的身份信息的过程就是人脸识别的过程。设置一个阈值,当提取出的特征与数据库中的样例特征相似度超过该阈值时输出匹配结果。

通过以上详细分析可知,系统涉及到人工智能、机器人学、图像处理与模式识别、数据挖掘、传感采集输入、精密机械等诸多领域的前沿技术。训练方案基于“构思、设计、实施、运行”,环环相扣,紧密联系,充分做到学中做,做中学。这种CDIO式运作的全过程做载体培养的工程能力,不仅促进包含个人的学术技术数据科学素养,还包含终生学习能力、不同年级不同专业交叉团队交流能力和大智能系统掌控能力。

3.2 用户脸部信息特征推荐工程训练的复杂性

(1) 必须运用深入的工程原理并经过分析才可能得到解决。平台构建人脸识别系统所使用的深度学习算法——卷积神经网络(简称CNN)算法是人工智能领域最新发展起来应用广泛,效率较高的典型深度学习算法。

在处理图像数据时,通过讲解构建不同结构的神经网络,演示导入过于庞大的推荐数据量时,对比不同算法训练效率和精度,就能够直观理解了CNN算法的局部感知、参数共享和多次卷积具体参数意义。

(2) 需要涉及多方面的技术,工程和其他因素,并可能相互有一定冲突

① 推荐算法的设计。所述深度学习智能算法使用CNN算法对用户大数据集进行模型的建立,结合基于用户的协同过滤推荐和基于物品的协同过滤推荐的两种算法的优点,最终推送给用户排分在前的商品。

② 综合技术应用。基于用户脸部信息的推荐分拣系统,对人工智能领域综合技术开发软件python、opencv、matlab等都有应用,其特征在于,所述深度学习智能算法、人机交互的推荐系统软件部分和相关性物品分类分拣系统硬件部分结构,能够识别出用户脸部信息的年龄、性别等特征,形成精准推荐。

③ 硬件架构设计阶梯式选择。系统推荐采集和分拣部分由物体分类模块、信号接收模块以及传输模块组成,可以分别采取不同阶梯式难度的控制器进行处理,命令发布能通过有线或无线收发模块进行信息传递、发送推荐分拣指令、编写程序指令控制传感器输入、电机的转速和舵机的角度等。

(3) 问题中涉及的因素可能没有完全包含在专业标准和规范中。人脸识别的评估标准主要有误识率、拒识率和识别的正确率,误识率是错误地将别人识别作指定人的概率,拒识率是错误地将指定人识别作别人的概率,识别的正确率是识别正确的人次与总参与人次的比值。本平台采用识别的正确率作为人脸识别系统的评估标准。

4 用户脸部信息推荐系统创新实践阶梯式训练内容

用户脸部信息推荐系统的硬件架构具体可分为移动机械臂、视觉、协同过滤推荐和推荐物流4个功能模块。针对本科阶段的不同年级学生对复杂智能工程抽象理论理解困境,以及编写智能算法的畏难情绪,将协同过滤推荐平台建设成操作演示型、参与设计型以及探索创新型的阶梯式单元训练项目。

4.1 实验环境配置项目(操作演示型)

平台的软件部分:推荐系统操作配置最新的python环境编写推荐系统程序; 在python2.7、Anaconda2、opencv2.4.13.4、caffe环境下编写人脸识别程序,其中采用了卷积神经网络算法,采集106 863张男性和女性530名人脸图像的数据集训练,测试实现了98.1%的识别率; 在应用SVM分类器模型,以及融合LBP算法及SVM分类器算法的模型证明了较高人脸检测及识别性别、年龄精度的模型; 将人脸识别应用到推荐系统中,能更快地获取用户信息,为用户进行分类,提高推荐速度。通过采集用户人脸信息,数据挖掘出用户年龄、性别,用于推荐的基于用户的推荐系统。

平台的硬件部分:搭建用户脸部信息推荐系统的硬件架构具体可分为移动机械臂、视觉、协同过滤推荐和推荐物流(用电机、传送带、单片机等元件构建分拣系统)的4个功能模块,分别电源管理后能够独立演示,或者串联整体演示,如图2所示。

图2 协同过滤推荐系统实物图

4.2 样本数据集的构建项目(参与设计型)

大型人脸数据集对于推进人脸识别研究很重要,但是它们的构建很繁琐,可以组织学生参与实施采集获取构建,如FaceScrub数据集。实际使用移动的机械臂安装摄像头。进行图像采集并进行图像处理的一系列操作后反馈出的识别结果,如图3所示。

图3 程序使用摄像头人脸年龄段、性别检测

可以看到推荐系统能够准确识别出人脸脸部位置及所处年龄段、性别、表情、种族。图3中右上角3个按钮分别为开始人脸检测、暂停人脸检测和退出,下方4个复选框中Detection代表是否检测人脸位置、Landmark代表是否标示出人脸检测的关键点、Gender代表是否显示性别、Age代表是否显示年龄。

4.3 算法分析(探索创新型)

推荐系统使用CNN等网络训练模型时,首先通过提取人脸脸型、器官结构及其间距等特征,获取人脸信息,根据这些信息分别建立人脸检测与识别、年龄识别、性别识别、表情识别与种族识别模型,并在识别过程中使用这些模型分工完成各项识别,相较单个模型完成多项特征的识别更容易准确获取图像信息。图4为3种算法人脸识别率正确率统计。

图4 3种算法人脸识别正确率统计图

通过对图4进行分析,在使用相同的数据集进行训练后,传统的SVM分类器对该人脸数据集的识别率不高,仅有约76.6%的识别正确率。融合LBP算法及SVM分类器算法后约有94.8%的识别正确率,而本文使用的CNN算法对该数据集约有98.1%的识别率,较前两种算法分别提升了21.5%和3.3%。由此可知,使用卷积神经网络算法可以有效的提升人脸检测及识别性别精确程度。

鉴于用户的算法以及基于物品的算法各有优劣,所以决定使用以上这两种算法实现本推荐系统的设计。首先为每一类用户手动初始化物品评分矩阵,根据人脸识别系统的反馈结果为新的用户进行分类,根据该分类及物品评分矩阵为用户进行推荐,而后根据用户是否点选该物品以及用户对该物品的评分,对物品评分矩阵进行优化,选择用户评分高的物品及与其相似的物品进行推荐。

本文中构建的推荐系统尚未经过大型数据集测试,在小范围的测试中,推荐点击率为16%。从图5中可以看出本文算法优于两种传统算法。下一步指导学生将平台扩大训练集的基础上,克服由于测试人数过少、数据训练不充分可能引起推荐结果的不确定性,以及对如何有效利用用户的评分以及对用户评分稀疏时如何减少其负面影响进行研究。指导学生为以后的设计提供需综合考虑各个算法的优劣势参考数据,根据用户需求实现性价比最高的方案设计。

图5 3种推荐算法的推荐点击率对比图

5 结语

人工智能视域下协同过滤推荐平台阶梯式教学培养过程,是从培养创新精神入手,以提高创新能力为核心,通过引导学生由易到难阶梯式地完成系统搭建与创新探索,有效应用学生学习的个性化、教学精准化和实时跟踪与反馈式督导,将更充分发挥学生主体性、主动性,带动学生独立学习、大胆探索、勇于创新能力的过程。

下一步继续指导学生进行创新实践探索,结合人工智能最新研究成果进行直观应用,如使用CNN算法的改进扩展算法——FASTER R-CNN图像处理算法,实现实时数据动态、快速、模糊情况更快的训练和识别速度以及更高的精度; 硬件架构加装提升整体处理程序配置,将推荐系统、视频音频实时数据识别系统、分拣系统高效地整合为一个系统,持续改进平台推荐工作效率。

猜你喜欢
人脸人脸识别协同
家校社协同育人 共赢美好未来
人脸识别 等
有特点的人脸
一起学画人脸
蜀道难:车与路的协同进化
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
“四化”协同才有出路
三国漫——人脸解锁
人脸识别在高校安全防范中的应用