许悦
摘要:高等职业教育是我国高等教育的重要组成部分,高校科研活动和教育教学形式逐步信息化。在新时代的社会发展要求下,高等职业教育要更加注重培养高级技能型、实用型和创新型人才,这就对教师的科研能力提出了高质量的要求。科研考核的目的是为了调动教职员工的科研积极性和促进学校科研发展,发现影响学校科研发展的因素,发现影响教职员工从事科研活动的原因,发现具有科研潜力的教师,从而有的放矢的制订学校的科研政策和开展学校的科研管理工作。高校科研考核是衡量教师科研成果和监督教师科研活动的一个重要评价方式,拥有一个适合的科研考核系统至关重要。文中针对辽宁工程职业学院的科研现状和科研考核政策,设计了基于.NET和数据挖掘的科研考核系统。
关键词:科研考核;关联分析;面向对象
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)24-0048-03
高职教师的科研质量直接影响高校对高级技能型、应用型和创新型人才的培养。建立基于B/S结构的科研考核系统,能有效节省人力资源,大幅度提升工作效率,有利于推动科研管理的“无纸化办公”进程,进而应用Weka数据挖掘工具对科研信息进行关联分析,为学校制订科研奖励激励政策提供参考。
1 高职院校科研管理现状及发展方向
高校的科研活动涉及众多人员参与其中,同时科研活动的有效开展需要规范化的制度和科学化的管理。目前,高校科研管理主要有两种形式,一种是传统的人工纸张办公,一种是网络平台无纸化办公,前者占主要部分,后者虽然大大提高了科研管理水平,但为了使大量的科研信息发挥更大的作用,充分发挥起预警和决策功能,对学校今后的发展起到指引作用,可以将数据挖掘技术应用于科研信息管理系统中,使数据分析智能化,这也是目前研究的方向。
辽宁工程职业学院是由六所中职学校合并而成,校龄短、师资弱,在以往的教育教学中,对科研管理工作一直采用人工管理办法。近几年,“大众创业、万众创新”成为新常态形势下的国家战略,学院更加重视培养高级技能型、应用型和创新型人才,并将这一培养目标作为学校发展的重要战略。在此发展背景下,学院不断改革、创新和发展科研管理工作,从多方面鼓励教师积极开展科研活动,对有科研成果在各层次获奖的教师给予表彰和奖励,此外,将教师的科研工作量完成情况,作为教师评定职称,年终评先选优的重要依据,将科研工作作为学院创新发展的主要动力之一。在政策的引导下,学院教师的各类科研成果,包括科研横纵项目、论文、专利等越来越丰富。如何管理学院教师的科研信息,如何考核各部门乃至教职员工的科研业绩,如何分析各部门和各类人员的科研状况及潜在的科研能力和水平,是学院考核各部门及教职员工科研能力的重要方面,也是学校提高科研总体实力的关键。
基于以上所述,笔者设计开发了基于.net和数据挖掘的科研管理系统,下面将简单介绍系统的开发过程,主要阐述如何将数据挖掘技术应用于科研信息管理之中。
2 基于ASP.NET技术的科研管理系統设计
科研考核系统采用Visual Studio 2010进行前台网页设计,以B/S结构为编程模型,以ASP.NET为开发平台,以C#为开发语言,使用SQL Server 2008作为后台数据库来完成系统的设计和实现。
2.1 相关技术介绍
2.1.1 ASP.NET技术
ASP.NET是微软公司研发的.NET平台的一部分,是一种动态的Web技术,该技术提供了新的Web应用程序编程模式,以Microsoft .NET Framework为开发基础,使开发人员能更加高效便捷地对web程序进行开发。[1]ASP.NET技术是实现B/S编程模型的重要技术工具,是实现科研考核系统重要的开发工具。
2.1.2 SQL Server 2008数据库
SQL Server 2008是微软公司最经典的数据库管理系统,它由众多组件相互协作组成,能最大化地满足企业数据处理系统和Web站点的数据分析和处理任务,拥有非常丰富的特性,SQL Server 2008通过ADO.NET技术与前端Web请求交换数据,开发工具Visual Basic、Visual C、Visual C++和开发平台.NET都支持运用ADO组件进行数据库的访问。[2]
2.2 科研考核系统的需求分析
通过前期调查研究,确定科研管理考核系统的总体开发目标是依据“适用、够用、实用、好用”的原则,并且综合考虑开发实力、开发的难度和实际需求等因素,功能开发应侧重于科研信息的分类管理、信息录入、教师检索和审核反馈等。系统将减少科研处在科研信息管理工作中的工作量,主要任务是实现教师个人信息、论文、论著、学术著作、专利、获奖、专业职称、科研工作量统计、教师科研能力等科研内容的信息化管理。在逐步开发的同时,对科研信息进行关联性分析,将数据挖掘技术应用到科研信息管理数据中,为学校科研决策提供参考。
2.3 科研考核系统的功能模块设计
科研考核系统提供的主要功能一是教师登录系统后上传科研信息和材料、浏览修改删除个人尚未被审核的科研信息和个人资料、查阅被审核的结果;二是审核员在线查询教师科研信息、进行教师科研信息的审核,并给出意见;三是管理员能够可视化地对各种新增或错误数据等进行维护;四是进行简单的统计分析,以便为数据挖掘准备数据来源。科研考核系统的主要模块包括:
1)用户以不同身份登录模块
2)教师模块:修改个人信息;在线提交、查询、修改论文、专利、科技奖项信息;在线提交、查询各阶段项目被审核信息。
3)审核人模块:修改个人信息;审核各阶段所提交的所有资料;按多种方式查询统计、打印汇总数据、科研信息关联性模块。
4)管理员模块:添加、修改、删除用户权限;查询、添加、修改、删除论文、专利、科技奖项、项目等相关的数据信息。
2.4 系统的数据库设计
科研考核系统数据库的设计包括概念结构设计和逻辑结构设计。根据辽宁工程职业学院科研考核系统的需求,得出科研考核系统中的实体联系图如图1所示。
3 基于数据挖掘技术的科研管理系统设计
数据挖掘技术是指将数据库技术和人工智能、机器学习等多学科相融合的产物,最终达到在大量的有噪声的、模糊的、随机数据中提取隐含、事先未知但又有用的信息,即从海量数据中发现隐含的、有意义的知识。
3.1 Weka软件
科研考核系统关联分析模块的实现借助Weka数据挖掘软件,通过科研考核信息的报表统计功能导出科研信息数据,经过对科研信息数据预处理操作后进行数据的关联规则提取,从而分析学院教师科研考核信息的关联性。在本例中,首先在系统中生成了一个页面,里面包含所有“科研项目”的数据记录集,然后执行相应代码,得到一个包含所有符合条件的数据的记录集,最后把此记录集中的数据导出,另存为CSV格式文件。Weka同时也支持数据预处理功能,因为Weka对ARFF格式的文件支持最好,所以通常将经过预处理后的数据集保存为ARFF格式。
3.2 利用Apriori算法进行科研考核信息关联分析
当教师将科研信息在线录入平台后,科研考核管理人员将科研信息数据导出并进行预处理操作,利用科研考核信息的关联规则Apriori算法对科研信息数据进行关联性分析,以教师类别为出发点,以其科研、论文发表、专利、专著、科技奖项、项目等级状况等为基础,对不同职称教师的科研能力和相关的政策制度做出关联性分析,为学院科研工作量化考核提供科学依据,同时给出相应的建议用以作为科研制度进一步完善的依据。
3.2.1 科研考核信息关联分析
Apriori算法是提取关联规则的经典算法之一,Apriori算法通过扫描数据集产生候选项集,并依据给定的最小支持度阈值和最小置信度阈值得到频繁项集。
科研考核信息的关联分析算法是改进Apriori算法并借助Weka平台实现的,其中Weka平台中实现关联规则分析的主要参数为car、classindex、delta等。在Weka中实现科研考核信息的关联分析Apriori算法主要包括步骤读取数据集,并提取样本集,离散化属性,创建Apriori关联规则模型,输出大频率项集和关联规则集四个步骤,其中创建分类器时,需要调整参数。[3]
科研考核信息数据中存在很多的噪声数据,因此需要对科研考核系统中导出的数据进行整理和归集。对于辽宁工程职业学院科研考核系统的信息数据中,姓名、额定分值、聘任情况、成果名称、成果类别、成果时间、统计年份和分项得分为不必要分析数据,需要从数据中删除。本文对科研考核信息数据的分析所使用的属性为教师年龄、学历、学位、职称、省级以上论文数量、省级科研项目数量、专著数量和专利数量,为了便捷和高效的分析数据,对以上属性进行预处理操作。
3.2.2 科研考核信息的关联规则分析
通过科研考核系统关联分析工具Weka中的Apriori算法进行分析,关联规则的提取结果会产生一维、二维、三维和四维关联规则。关联分析如下:
在对教师基本信息及所有科研信息作了关联挖掘之后,发现教师职称为初级的与科研工作类别里的论文关联度高。经分析,原因为:首先是学院在科研工作评价得分设置里对论文设置的得分权重比较高,其次是具有初级职称的教师一般很难参与到其他科研项目中去,对于他们来说,发表论文相对比较容易,因此为了完成额定工作量,大多数具有初级职称的教师更倾向于在一般刊物上发表论文。
因此,可以建议未来的科研工作量统计中,要对一般论文的得分权重有所降低,但不改变高级别论文的得分权重。并且建议院系未来在落实课题项目和其他相关科研项目中适当增加初级职称教师的数量,而且需要分配实质性的工作来提高初级职称教师的科研能力。
通过关联挖掘,发现对于职称相同的教师,近年新进教师的科研得分与科研得分为“高”的关联度比较高,而原学院教师的科研得分与科研得分为“低”的关联度比较高。经分析,原因是:其一,近年新进教师基本上均是具有硕士学历或学位,其理论水平比较高,且动手能力比较强;其二,原学院科研能力比较薄弱,特别是当升格为高职后,教师很多原来擅长的领域及专业均被取消,从而导致有些教师即使科研能力比较强,也难有用武之地。
针对该数据挖掘结果,可以建议学院重点培养近年来新引进的具有高学历的教师,因为从数据挖掘结果中看出,这部分教师虽然职称比较低,但是却体现出了比较高好的科研能力,具备很强的科研潜力。这也再次证实了学校引进人才的方向是正确的。但需要注意的是,不应该放弃科研得分较低的群体,而是要通过正确引导,为他们开辟新的科研空间。
4 结束语
因为本系统使用时间不长,数据量比较小,所以数据挖掘的基础条件有欠缺之处,再加上对数据挖掘理论知识的认识还不够深入,所以得到的数据挖掘结果不一定能够精准地反映客观现实。但是總体来说,所得到的数据挖掘结果基本均是基于正式的数据挖掘方法的,虽然结果会有偏差,但整体上仍较能反映实际情况,给科研工作提供了参考。
今后,可以进一步优化代码,对于随时发现的缺陷及时改进、解决,采取更多更优的数据挖掘方法进行挖掘和分析。
参考文献:
[1] 李雪婷.基于ASP.NET的高校科研成果管理系统的设计与实现[D].厦门:厦门大学,2013.
[2] 田卫东,陈浩.一种精简的关联规则表示模型[J].计算机应用研究,2015,32(3):658-661.
[3] 田苗凤.大数据背景下并行动态关联规则挖掘研究[D].银川:兰州交通大学,2015.
【通联编辑:代影】