基于煤矿从业工种的安全生产教育资源推荐服务的研究

2022-11-16 02:14郑阳平
承德石油高等专科学校学报 2022年5期
关键词:工种矿工煤矿安全

郑阳平

(承德石油高等专科学校 计算机与信息工程系,河北 承德 067000)

1 基于煤矿从业工种的安全生产教育资源推荐服务建设的要素

随着时代的发展和移动终端的普及,随时随地在线自主学习成为知识获取的重要渠道,推进移动化泛在学习已经成为时代发展的需要。在线开放课程、精品资源共享课、云课堂、MOOC(慕课)等形式的在线学习已经成为现代学习者的主要学习方式和知识获取途径。煤矿安全教育云平台建设也在逐步兴起,面对煤矿从业工种较多,资源种类和类型繁多,如何针对某一从业工种,快速将适合的煤矿安全生产教育资源实体推送给一线矿工。因为一线矿工文化程度不高,学习积极性不高。通过一线矿工注册的信息,获取其从业的工种和工作岗位,记录学习行为,运用大数据和数据挖掘技术,智能智慧推荐相关学习资源,保证一线矿工必须技术知识的学习。基于从业工种的煤矿安全生产教育推荐服务应从以下四要素着手建设:

1)煤矿安全生产教育资源建设。煤矿安全生产教育资源以形象、生动、乐学、易学为原则进行设计开发。根据煤矿一般从业人员、班组长、安全管理人员分类,大致可以分为,十大特殊工种(如井下爆破,瓦斯抽采,掘进机等)和21个一般从业工种(采煤工、防尘工、掘进工、轨道工等)。对每一从业工种,按照技术增长路线进行资源建设,并且为每个资源打上特征标签,如工种、工作岗位,能力、技能点等,以短视频、图片、漫画、3D动漫、VR仿真警示教育体验等信息化形式展示给一线矿工,使煤矿安全生产教育资源具有感染力和吸引力,促使一线矿工兴趣娱乐学习。短视频主要演示操作规范和技术要点;3D动漫形象直观、生动地将煤矿中的人、机、环、管危险源的过程再现,将枯燥的安全知识点通俗生动的表现出来,让一线矿工在轻松的氛围中熟识各类危险源,掌握排除危险的方法;VR仿真警示教育体验是在建立的煤矿生产操作虚拟环境,将不可见的地下的一些不安全行为操作形象、直观的表现出来,提高井下工人的安全意识,克服不良习惯,促进安全生产。

2)煤矿安全生产教育云平台建设。煤矿安全生产教育云平台以简单、易学、开放、实用为原则进行开发和设计。智慧云平台通过对一线矿工用户工种、工作岗位、学习行为和个性特征的采集与分析,应用智慧推荐策略,推送相对应的学习资源,从而实现基于工种的技术知识学习。本平台采用HDFS和关系型数据库相结合的存储结构,通过数据库的检索查询,获取资源实体在HDFS中的存储位置,实现对煤矿安全生产教育资源的访问。

3)煤矿安全生产教育资源智能化搜索建设。随着信息爆炸式增长,煤矿安全生产教育教学资源储备呈现海量化特征,根据一线矿工用户搜索的关键字,结合工作和工作岗位,在海量化的教育教学资源中,利用知识图谱和用户行为数据快速的缩小搜索范围,将精确的煤矿安全生产教育资源快速的推送一线矿工学习。

4)煤矿安全生产教育资源推荐服务建设。面对安全生产教育资源信息过载引起的问题,如何改变学习者(一线矿工和安全管理人员)的学习行为,由主动的利用搜索引擎寻找学习资源转变为被动的接收基于特定工种的煤矿安全生产资源的推送,是智慧推荐服务建设的目的。通过收集较为完整的学习者的学习行为、基本档案信息、兴趣爱好等特征向量构建学习者模型,在学习者和煤矿安全生产教育资源、学习者和学习策略之间建立连接。借助于学习者特征向量、学习煤矿安全生产教育资源特征向量和学习策略特征向量之间的关系纽带进行科学的计算,生成学习诊断或建议,智慧推荐基于从业工种的学习内容或学习路线。

2 煤矿安全生产教育资源推荐服务关系模型

煤矿安全生产教育资源推荐服务主要涉及学习者(一线矿工和安全管理人员)、煤矿安全生产教育资源和云平台三个实体,云平台是教育资源载体,同时收集学习者的一些属性和学习行为,煤矿安全生产教育教学资源是云平台与用户衔接桥梁。推荐服务通过洞悉学习者的需求,提供针对某一工种的煤矿安全生产教育资源,确保其从事安全生产,避免无知型违章。借助学习者特征向量、煤矿安全生产教育资源特征向量和学习策略特征向量的关系纽带,将学习者与学习资源或学习策略连接起来。学习者特征向量包括学习者基本信息(编号、性别、工种、工作岗位、关注对象等),学习风格(认知风格、媒体偏好、学习倾向、兴趣爱好等),学习行为(学习内容、学习时间、学习资源类型、学习过程、测试评价等)。引入学习资源特征描述的目的是通过其特征描述、评论信息和属性标记等方式,使得学习资源的管理和检索更加便捷。煤矿安全生产教育资源特征向量包括资源描述、工种类型、工作岗位、知识点、技能点、能力、媒体类型、难易程度和资源评论等。学习策略特征向量包括认知策略(记忆、理解等)、元认知策略(学习计划、学习过程记录等)和资源管理策略(学习时间、评价等),各个策略都有自己对应的子策略(见图1)。

3 基于煤矿从业工种的安全生产教育资源推荐服务

3.1 基于煤矿从业工种的安全生产教育资源推荐服务系统框架

随着互联网+和电子商务的快速发展,推荐服务系统越来越被人们重视。基于煤矿从业工种的安全生产教育资源推荐服务系统整体框架,如图2所示,其中,推荐算法和数据挖掘技术是推荐服务系统的重要组成部分。

协同过滤推荐技术分为基于User协同过滤推荐(User CF)和基于Item协同过滤推荐(Item CF)。基于User协同过滤推荐算法,通过一线矿工用户对煤矿安全生产教育资源评价来评测学习者之间的相似性,推荐那些有共同工种和兴趣爱好的用户所感兴趣的资源,优点是适合性较强,适用于用户个性化兴趣不太明显的场景,缺点是存在冷启动问题和稀疏问题;基于Item的协同过滤推荐算法是给学习者推荐哪些资源相似的煤矿安全生产教育资源,优点是可以有效进行长尾挖掘,能够发现学习者潜在的兴趣爱好,缺点是过于依赖用户行为,存在冷启动问题,多样性较差。混合推荐技术集两者优势,在不同的阶段使用不同的推荐技术,以达到最佳的推荐效果。

3.2 基于从业工种的煤矿安全生产教育资源之间的相似度计算

关于煤矿安全生产教育资源相似度计算的方法有很多,如殴氏距离、曼哈顿距离、余弦相似度、杰卡德相似系数和皮尔逊相关系数等。学习者与煤矿安全生产教育资源相似度描述了不同学习者的兴趣与关注资源的相似程度,将学习者对某一煤矿安全生产资源的喜好或者评价作为一个特征向量,该向量值越高,则说明学习者对煤矿安全生产教育资源类别中的相关资源的兴趣度越高。因此,建立一个从煤矿安全生产教育资源1到m的矩阵Am×n来表示学习者对各个类别煤矿安全教育资源的喜好程度。其中,m表示煤矿安全教育资源数,n为学习学习者总数,元素xij表示第i个学习者给第j个煤矿安全教育资源感兴趣程度。

由于学习者对煤矿安全生产教育资源选择及感兴趣程度不同,这里采用杰卡德相似系数进行计算,自定义其函数为def Jaccard(a, b),其公式如下:

式中,Sim1,m表示煤矿安全教育资源1与煤矿安全教育资源m的相似度,A1∪Am表示对煤矿安全教育资源1与煤矿安全教育资源m感兴趣的学习者总数,A1∩Am表示同时对煤矿安全教育资源1和煤矿安全教育资源m感兴趣的学习者总数。通过计算,完成各个煤矿安全教育资源之间的相似度计算,即可构成一个煤矿安全教育资源相似度矩阵,如表1所示,根据所建立的相似度矩阵,推荐算法会向学习者推荐与相应煤矿安全教育资源最相似的K个煤矿安全教育资源,同时根据对推荐的内容进行排序,将已经学习过的煤矿安全教育资源给予剔除。通过计算相似度矩阵的函数def similarity(self, x, distance)进行实现。

表1 煤矿安全教育资源相似度矩阵示例

3.3 计算学习者(一线矿工或安全管理人员)学习兴趣矩阵

在面向一线矿工的煤矿安全生产教育资源云平台中,提供了与学习者交互的页面,学习者在云平台中的绝大多数学习行为,都会被记录在用户日志和后台数据库中。学习者行为数据主要存储三个字段:用户ID,煤矿安全教育资源ID,资源标签和喜好反馈值,如表2所示,学习者的学习行为可以归结为二元特性,即感兴趣或不感兴趣,学习或者不学习。学习者对煤矿安全教育资源发生的行为可以认为是对此资源所带标签的行为。煤矿安全教育资源推荐系统通过分析学习者的行为数据,进行数据挖掘和计算,并将结果存储在后台数据库中。

表2 一线矿工或管理人员学习行为分值表

与基于从业工种的煤矿安全生产教育资源之间的相似度计算相似,同理,从学习者的学习行为数据库中,提取偏好矩阵Rm×n来计算学习者的兴趣矩阵Pm×n,计算公式为:

Pm×n=Simm×n×Rm×n

这样就度量了推荐算法中学习者对煤矿安全教育资源的感兴趣程度。

3.4 基于工种的技术知识增长路线推荐服务

事实上,Item CF推荐算法已经可以实现结果的推荐,但是它的推荐结果是相似度较高的煤矿安全教育资源,如某个知识点或技能点的视频、文档、习题等,基本属于同一级别的知识点,对知识增长和学习路线的推荐结果可能不够理想。所以,构建以某一工种技术知识增长路线推荐就显得非常重要。以某一工种技术知识点为中心,建立该技术知识的前导必须知识点或技能点以及后续紧邻知识或技能点。如图3所示井下采煤工技术知识增长路线关系模型,当学习者在学习或者搜索“采掘工作面安全”这一技术知识时,与它相似度较高的教学资源较多,就需要对这些相似度较高的知识点和技能点,进行关系因子修正,然后将后续紧邻的技术知识点(如矿井灾害防治)推荐在前几位,使其朝着知识增长路线推荐。关系修正因子δ取值范围为[0,1],当δ接近1时则表示系统更加趋于知识增长路线推荐。对于同级别教学资源其修正因子为δ=0.96,前导必需知识相关的教学资源(如TCP协议格式)关系修正因子δ骤然递减,如0.90,0.70,0.40,0.00;后续紧邻知识点关系修正因子为δ=1.00,再后续知识修正因子δ骤然递减,这样就可以使学习者按照知识增长路线进行系统学习。需要说明的是,通过构建基于从业工种的技术知识增长路线关系库,根据大量数据进行模型训练和深度学习得出关系修正因子,实现修正推荐结果更加精确。通过技术知识增长路线关系库的构建,一是可以避免Item CF推荐算法存在的冷启动问题,二是能够改进推荐结果,使推荐结果朝着知识增长和认知规律方向发展,满足学习者循序渐进的知识或技能求知欲。最终,计算公式为:

T=δ×Pm×n

通过应用函数def recommend(self, a)得出最终煤矿安全生产资源推荐列表。

4 效果评价

为了对比改进的Item CF个性化推荐算法优劣性,评测过程中引入非个性化算法:Random算法和Popular算法。其中,Random算法每次都向学习者随机推荐没有产生过学习行为的煤矿安全生产教育资源;Popular算法是按照煤矿安全生产教育资源的热度或流行度,向学习者推荐没有产生过学习行为的煤矿安全生产教育资源中最热的资源。采用交叉验证的方法,对上述三种算法分别进行数据建模分析,获取三种算法的推荐效果评价。为了更加直观的获得评测推荐结果,在煤矿安全生产教育资源学习过程中,认为只有感兴趣与不感兴趣两种选择。针对这种数据类型的预测,引入准确率和召回率分类准确度指标,其中,准确率表示学习者对被推荐煤矿安全生产教育资源的感兴趣程度;召回率=正样本预测结果数/正样本实际数,表示一个学习者喜欢的煤矿安全生产教育资源被推荐的概率。通过对比三种推荐算法,在采取不同的推荐K值(分别取值为3、5、10、15、20)的情况下得出的准确率与召回率的评价指标,如图4所示。从图中可以看出,Random算法的推荐结果最不理想,几乎为0;Popular算法随着推荐数K的增加,其召回率在增长,准确率将降低,推荐效果较差;基于改进的Item CF推荐算法,随着K值得增加,召回率也在同时增长,准确率也在上升,当到达某一临界点时,其准确率随着K值得增加而趋于平稳。

实验中还发现,针对数据类别的多样性和复杂性,可以采用基于煤矿安全生产教育资源的相似矩阵最大值进行归一化,这样不但可以提高推荐的准确率,还可以提高推荐覆盖率和多样性。

5 结语

个性化推荐服务系统在电子商务、社交网站等众多领域有着广泛的应用,并逐渐扮演更重要的角色。在互联网+飞速发展的今天,通过对一线矿工用户行为数据的分析,结合用户工种和工作岗位,采用基于Item CF推荐算法,通过构建的基于从业工种的煤矿安全生产教育资源关系库,向一线矿工用户和安全管理人员推荐从业工种所必须的煤矿安全生产教育资源,通过在线学习,使其达到从业资格,胜任工作岗位。基于煤矿从业工种的安全生产教育资源推荐服务符合新时代发展的需要,可以解决煤矿安全生产教育培训的一些问题,变传统培训学习为休闲娱乐学习,是一线矿工和安全管理人员随时随地学习的小助手。面向一线矿工的煤矿安全生产教育资源推荐服务研究的推广和应用,将使煤矿一线职工受益,很有可能培养一批批能工巧匠。

猜你喜欢
工种矿工煤矿安全
金牌挖矿工
特殊工种提前退休问题探析
强化忧患意识,推动全国煤矿安全生产形势持续稳定向好
老矿工的家国情怀
抓煤矿安全基础建设四大支柱
我能按照从事有毒有害特殊工种办理提前退休吗
新形势下如何实行特殊工种提前退休政策
矿工老李
特殊工种提前退休有哪些规定?
对如何提高煤矿安全培训质量的思考