基于深度神经网络的智能交互式学习系统

2022-11-18 14:01李小欢
电子设计工程 2022年22期
关键词:神经网络深度特征

王 欣,雷 珺,李小欢,汤 成

(中移(杭州)信息技术有限公司,浙江 杭州 310000)

《教育信息化十年发展规划(2011-2020 年)》中提出要“促进人才培养模式创新。加快对课程和专业的数字化改造,创新信息化教学与学习方式,提升个性化互动教学水平…”。现有的在线学习平台普遍存在重内容建设轻应用深度,其信息技术与教学融合不深等问题。究其原因在于平台往往仅基于人工设计规则对学生学习状况进行反馈,模式单一、内容推荐不精准,从而无法有效提升学生的学习主动性,造成资源浪费。针对以上问题,该文提出了基于深度神经网络的智能交互式学习系统。通过神经网络获取特征的效率更高,鲁棒性更强,实现了更精准的推荐,缓解了传统人工涉及规则的在线学习系统中出题模式单一,无法针对性提升学习内容的缺点。同时采用基于微服务实现的智能交互式学习系统相较于传统在线平台,具备易于开发、维护,上线部署快等优点,相较于传统的单体应用,较大地缩短了平台的更新发布周期。

1 推荐系统

1.1 推荐系统简介

推荐系统可以被视为一个搜索排序系统,需要解决搜索排序的问题,做好记录和生成两个关键工作。记录需要系统能够通过用户的一系列行为操作和属性来更新用户画像,最直接的方式就是利用用户历史数据的相关性以及这一类用户画像出现的相同特征。生成则需要系统根据用户画像自动生成最优的排序结果,最重要的是体现基于相关性的传递性,探索一些潜在的联系。推荐系统中嵌入的模型根据是否依赖深度学习可分为基于传统因子分解的因子分解机和深度神经网络[1-2]。

针对传统因子分解机存在的问题,He 提出一种新的模型神经因式分解机(NFM),用于稀疏环境下的预测,NFM 将FM 在二阶特征交互建模中的线性和神经网络在高阶特征交互建模中的非线性无缝结合[3]。Vozalis 提出了基于奇异值(SVD) 分解的协同过滤算法,在协同过滤算法中引入奇异值分解,较为有效地解决了数据稀疏问题[4]。

结合推荐系统的使用场景,最近还有研究者根据实际应用场景,添加了经济学的价值论在模型之中,使模型的效果更佳优异。Zhao 提出了多产品效用最大化(MPUM),它将消费者选择的经济学理论与个性化推荐相结合,重点研究产品集对个体用户的效用[5]。Zhang 提出了历史影响感知潜在因素模型(HIALF),这是真实评级系统的第一个模型,用于捕捉和减轻单个评级中的历史扭曲[6]。

推荐系统中的嵌入深度学习技术具有以下优点:1)借助深度学习的深层非线性结构构建了用户和项目的潜在特征向量,从用户和项目相关的海量数据中学习到深层次表示信息,从而挖掘数据背后的隐含特征,提高了模型的表述能力;2)基于深度学习的推荐系统通过集成来自多个异构数据源的用户/物料画像较好地缓解算法冷启动问题。

该文从企业内部党建学习平台的个性化服务理念入手,构建一套基于“云”+“端”融合的智能交互式学习系统。该系统利用用户历史学习、答题数据,通过深度神经网络Deep&Wide 离线训练得到一个面向个体用户的知识推荐模型,以该模型为基础,实现精准知识点推送服务,包含每日知识推送、定期问题更新、前后期知识反馈等。该系统旨在培养用户自主学习的能动性,提升企业党建学习的用户粘性和学习有效程度。通过对智能交互式学习系统关键技术的讨论,分析学习用户的个人知识推荐模型建立和系统平台开发的基本流程。该系统能依据学习者相关的学习信息建立学习者的个性化知识推荐模型,驱动学习者主动学习与自主评测补漏,极大地促进了人工智能技术在教育领域,尤其是在线教育领域的技术落地与发展[5-6]。

1.2 数据收集及预处理

用户学习数据的收集和预处理是建立智能知识推荐模型非常关键的一步,是实现整个系统的先决条件。用户数据详细记录了学习者的学习过程,为建立针对其个性化的学习模型提供了充分的数据支撑。

训练样本一共采集了1 536 名用户的历史学习数据及用户个人信息,如表1 所示,其中涉及对象的个人特征,如年龄、岗位、学历以及性别等,还包含对象在学习系统中的行为数据,如每日学习时长、学习内容类别和学习内容类型等。

表1 用户样本数据

表1 中描述的用户数据,在输入深度神经网络前都会经过预处理转化为向量,因为上述特征均为离线特征,在预处理上该文采用一位有效编码(One-Hot Encoding)对输入特征进行编码,相较于其他编码方式如哈希编码,一位有效编码后向量依旧具有实际意义,可映射回原有特征;相较于特征学习的编码方式,一位有效编码不需要大量的语料进行训练。

编码成向量后,经过一层嵌入层(Embedding Layer)映射到同一维度的低维稠密向量,该向量维度为可变参数,该文经过测试选取128 位嵌入向量作为深度神经网络的输入。数据预处理分为向量构建和数据量化——将原有的数值按量化条件转为向量[7-8]。

1.3 搭建深度神经网络

目前,深度神经网络架构广泛,有卷积神经网络(CNN)、循环神经网络(RNN)和注意力神经网络(Transformer)等。该文采用如图1所示的Deep&Wide深度神经网络算法模型,将1.2 节中的所有数据特征都输入Deep 子模型,另外从中选取与学习过程强相关的特征——每日学习时长、每周学习时长、学习内容类别、学习内容类型、答题历史、知识点内容类别、知识点内容类型、知识点历史作为Wide 子模型输入,Deep 子模型为多层神经网络,Wide 部分为线性模型。

通过Google 深度学习框架TensorFlow 实现Deep&Wide 模型,其输出为二分类:1 即用户与知识点匹配,0 即用户与知识点不匹配。Deep 模型部分重点在Embedding 层和后面三层以ReLU 为激活函数的隐藏层,存在中间通过Concatenated Embedding 层拼接所有Embedding 层输出的128 位低维特征向量,最后输入损失函数进行计算。

传统的Deep&Wide 深度神经网络算法同时学习低阶和高阶组合特征,它混合了一个线性模型(Wide part)和Deep 模型(Deep part)。这两部分模型需要不同的输入,而Wide part 部分的输入,依旧依赖人工特征工程,导致模型偏向于提取低阶或者高阶的组合特征,而不能同时提取这两种类型的特征。该文算法Deep 模型后面的三层分别是以ReLU 为激活函数的隐藏层、线性模型和Dropout 层,Dropout 的机制:在每次神经网络的反向传播中,会随机选择一些神经元,设定其反向传播对应的参数为0,然后对于被改变后的神经网络进行反向传播,削弱模型对于低阶或者高阶的单一特征依赖,更容易学习到低阶和高阶特征的组合,相对于深度因子分解方法,该文方法计算效率更高,模型计算更为有效[9-10]。

每一隐藏层计算如式(1):

ReLU 的定义为:

1.4 智能推荐模型实验结果

Deep&Wide 联合模型一共使用了1 536 名用户数据,从用户数据中提取知识点总计7 588 个,经数据清洗及标注后得到101 202 个样本数据,为了防止过拟合/欠拟合,将正负样本比例控制在10%,进行k-fold 交叉验证(k=10),得到验证集的准确率如表2所示,最后得到平均准确率为89.08%。

表2 k-fold交叉验证结果

另外,针对Embedding Layer 的128 维低维稠密向量,对这个128 维度参数做比对实验,其于训练并行计算和先前研究结果,维数皆为2 的幂次,结果如表3 所示,发现256 维为最佳,维度增加并未与准确率成正比,为在计算速度和准确率之间做平衡,最后应用选取128 维。

表3 嵌入向量维数对比结果

为了验证该文算法改进的有效性,在Embedding Layer 的128 维低维稠密向量的基础上,通过消融实验对比增加dropout 层前后的准确率,可以看出添加dropout 层后,验证集准确率相较于原始Deep&Wide模型提高了6.76%,如表4 所示。具有明显的提升效果[11-12]。

表4 dropout层消融实验交叉验证结果

2 系统架构及功能

2.1 微服务架构技术简介

微服务架构(Micro-service Architecture)是一种架构概念,通过将功能分解到各个独立的服务中实现整个服务系统的解耦。微服务的概念是2012 年提出的,用来满足Web 和移动应用快速开发的需求。微服务的定义范畴如下:1)分布式服务组成的系统;2)按照业务而不是技术来划分组织;3)做有生命的产品而不是项目;4)强服务个体和弱通信(smart endpoints and dumb pipes);5)自动化运维(DevOps);6)高度容错性;7)快速演化和迭代。相较于传统的单体应用架构,微服务架构的优点如下:1)提升开发交流,每个服务足够内聚,足够小,代码容易理解;2)服务独立测试、部署、升级、发布;3)可按需定制产品生命周期和资源利用率,每个服务可以各自进行扩展,而且每个服务可以根据自己的需要部署到合适的硬件服务器上;4)可按需选择冗余备份的模式,选择接受服务的实例个数;5)容易扩大开发团队,可以针对每个服务(service)组件开发团队;6)提高服务容错性,一个服务的内存泄露并不会让整个系统瘫痪;7)便利新技术的应用,系统不会被长期限制在某个技术栈上。

2.2 智能交互式学习系统架构

智能交互式学习系统架构分为在线和离线两个子系统。离线子系统负责大数据分析和深度神经网络训练验证。

如图2 所示,党建学习平台总体架构分为负载均衡层、连接层、服务层及数据层,每一层在逻辑上相互独立且支持扩展。

负载均衡层舍弃了传统的F5 硬件负载均衡(Load Balance)方案,采用了Nginx 软件负载均衡方式,大大降低了运维成本,同时提高了系统的灵活性。

连接层负责接入各终端、业务系统,通过采用前后端分开、自研轻量级交互协议、移动端维持长连接的方式,实现终端用户良好的使用体验[13-14]。

党建学习平台的关键是服务层,服务层负责平台业务逻辑,各个服务之间可以进行相互通信,运用服务治理的设计理念,实现服务之间负载自动均衡和提升系统的扩展性;另外,服务层引入嵌入式监管的理念,实时监控服务生命周期的健康水平。服务层承接“智能知识推荐模型”的运行,针对每个用户提供个体化学习与评测内容。

数据层负责各服务的数据、文件、通知-推送、缓存的存储管理,其中数据通过离线备份到深度神经网络训练平台,用于模型训练及验证。

3 应用成果

以智能交互式知识学习系统为核心的党建学习平台自建设上线以来,为十余个省市提供了党建知识学习信息化服务,通过发起在线考试了解党员的学习成果,后台自动统计结果,高效省时,减少了以往组织类似竞赛活动的人工成本和时间成本,并有力推动了党群部门的无纸化办公应用。同时,广大省市移动公司通过联合当地组织部门开展竞赛活动,进一步在当地扩大了公司的影响力并提升了广大用户的4G 流量使用度,社会价值和经济价值均有所体现[15-16]。

根据平台数据统计,部署了智能知识推荐模型后,参与党建学习平台活动的各单位党员的学习效率显著提升,与传统学习方式相比,使用该平台后,党员的党建知识测评平均分提高了15 分,党建活动的员工参与度也上升了30%。截止目前,党建学习平台已经接入移动云、小移人家、和飞信、和办公、和助理等诸多APP 产品中,累计服务单位近80 家,服务党员规模超过100 万人,累计答题数超过5 000 万人次,累计直接创收超过300 万元。

4 结论

从党建学习平台的个性化服务理念入手,以深度神经网络和机器学习技术为基础,针对现有学习资源多元冗余但缺乏智能化交互的网络学习平台,该文提出了一种自动记录用户历史学习数据、离线训练智能推荐模型、在线应用模型的智能交互式知识学习系统。通过对系统设计和模型研究的详细介绍,分析和讨论了学习平台和智能推荐模型的基本研究过程和关键技术点。该系统能依据学习者相关的学习信息建立学习者的个性化知识推荐模型,驱动学习者主动学习与自主评测补漏,极大促进了人工智能技术在教育领域,尤其是在线教育领域的发展。

猜你喜欢
神经网络深度特征
基于神经网络的船舶电力系统故障诊断方法
四增四减 深度推进
深度思考之不等式
离散型随机变量的分布列与数字特征
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
抓特征解方程组
不忠诚的四个特征
简约教学 深度学习
基于神经网络的中小学生情感分析