大数据环境下基于数据挖掘技术的高校科研管理系统的设计

2017-04-15 21:18刘占波王立伟王晓丽
电子测试 2017年2期
关键词:数据挖掘管理系统模块

刘占波,王立伟,王晓丽

(牡丹江医学院,黑龙江牡丹江,157011)

大数据环境下基于数据挖掘技术的高校科研管理系统的设计

刘占波,王立伟,王晓丽

(牡丹江医学院,黑龙江牡丹江,157011)

本文简要分析了目前高校科研管理现状;介绍了大数据与数据挖掘技术;给出了大数据环境下高校科研管理系统的设计方案。

科研管理;大数据;数据挖掘

0 引言

近年来,大数据技术引起了科技界、产业界和政府部门的高度关注。Nature和Science 等国际顶级学术刊物相继出版专刊来探讨对大数据的研究,大数据的开发与利用已经在教育、科研和医疗等行业中展开。

随着数据量的与日俱增, 科研管理数据库中蕴藏着大量的信息资源,需要有更先进的技术对海量数据进行挖掘以发挥科研数据潜能,从中迅速提取出有价值的信息以指导和辅助科研管理。因此,有必要在科研管理中引入数据挖掘技术,以提高科研管理的水平和能力。

1 高校科研管理现状

随着高校信息化建设的不断推进, 高校内部运行着的各种系统和各类数据库,如教务系统、学工系统、人事系统及科研管理系统等。而各个系统间各自为政,数据共享性差,存在严重的信息孤岛。而科研管理系统通常又包括项目管理系统、经费管理系统和成果管理系统等多个子系统,各子系统数据独立存储,无关联性,严重影响了科研数据的挖掘利用。在功能上,科研管理系统主要集中在数据的收集、查询、管理、导出、打印等单一功能。随着数据容量的与日俱增,系统对海量数据的分析统计功能简单、缺少对数据的关联分析、挖掘利用与决策支持等功能。目前的高校科研管理在一定程度上滞后于科研本身的发展或阻碍着高校科研的发展。

2 大数据

所谓大数据,就是用现有的一般技术难以管理的大量数据的集合。大数据的特征,通常用四个V开头的关键词来描述,一是Volume(容量),也就是数据体量大;二是Variety(多样性),即数据类型繁多;三是Velocity(速度),数据产生和更新的频率快;四是Value(价值),数据价值密度低,即海量的数据可能包含极少量的有价值的信息。所以,如何高效提取这些有价值的信息是关键。大数据技术是网络技术、数据库技术和人工智能技术的有效结合,是解决数据丰富而知识贫乏的有效途径,其实质是从数据中提取隐含的、未知的和潜在有用信息的过程,被公认为是数据库研究中的一个极富应用前景的新领域。

3 数据挖掘

数据挖掘是从大量数据中发掘有趣模式和知识的过程,数据源包括数据库、数据仓库、Web、其它信息存储库或动态地流入系统的数据。目前,数据仓库和数据挖掘已成为学术研究、商业应用以及行政管理的热点。数据挖掘技术在国内外大型商业、金融、工业、邮电和科研等部门得到广泛应用。在科研管理中引入数据挖掘技术,是解决科研数据丰富而知识贫乏的有效途径,可为高校科研管理提供决策支持。

4 科研管理系统设计

4.1数据标准化

近年来,高校科研事业快速健康发展,科研及相关数据容量越来越大,蕴含的信息越来越多,数据挖掘技术的有效利用将成为高校科研发展的关键因素。为了更好的实施数据挖掘技术,必需对科研数据进行标准化处理和相关关联参数的设置。比如:科研项目的项目名称、立项时间、项目起止时间、经费和关键词等。标准化数据将有利于科研数据的收集、比对、整理、分析及数据挖掘技术的有效应用。

4.2系统的主要功能高校科研管理系统主要划分成如下模块:项目申报模块、项目管理模块、成果管理模块、成果获奖模块、学术交流模块、数据挖掘模块和系统管理模块等。项目申报模块:实现校内科研项目的申报、审核、评审、立项等功能。项目管理模块:实现科研项目信息的录入、查询、管理(项目的暂停、中止与结题等)、数据分析与统计和科研经费管理等功能。其中科研经费管理包括科研经费的进帐、提取、支出与结转四个方面。成果管理模块:科研成果是高校从事科研活动的主要结果,能够反映高校的整体科研水平。该模块主要功能是实现著作、论文、专利与鉴定成果等信息的录入、查询、管理与数据分析等。成果获奖模块:主要功能是记录成果报奖信息与成果的获奖信息,并对相关信息进查询、管理、统计与分析等。学术交流模块:该模块涉及到学术会议(举办/参加)、受聘讲学(派遣/接受)、访问考察(派遣/接受)、进修学习(派遣/接受)四个方面。数据挖掘模块:对科研数据进行不同维度的数据挖掘,为科研管理提供决策支持。系统管理模块:为系统管理员及部门、科室管理员提供实时监控系统运行的状态,包括系统相关参数、开关、用户权限的设置及系统基本信息、用户数据、系统日志及数据库的管理与维护等功能。

4.3关键技术

系统采用基于Microsoft .NET技术的B/S(浏览器/服务器)模式运行,用户通过浏览器就可以实现科研数据的管理与维护;系统前台web页面采用Microsoft Visual Studio 2010开发环境进行设计与制作;系统后台科研与成果数据库采用Microsoft SQL Server 2008进行数据库设计与数据的存储。系统通过数据挖掘技术对数据进行分析、整理,最终形成数据分析报告。

4.4数据挖掘算法

系统拟采用的数据挖掘算法包括:(1)Apriori算法,是一种最有影响的挖掘布尔关联规则的算法。该关联规则在分类上属于单维、单层、布尔关联规则。(2)C4.5算法,是机器学习算法中的一种分类决策树算法,机器学习中,决策树是一个预测模型;它代表的是对象属性与对象值之间的一种映射关系。(3)贝叶斯分类的基础是概率推理,就是在各种条件的存在不确定,仅知其出现概率的情况下,如何完成推理和决策任务。通过上述数据挖掘算法实现对科研数据关联性的分析及数据的深度挖掘,并对高校科研管理工作提供决策支持。

5 结束语

本系统除实现科研管理的基本功能之外,主要实现从不同角度,依据不同参数对科研数据的关联性等方面的研究。并使用不同的数据挖掘算法对科研数据进行分析与数据挖掘,为高校的科研管理提供决策支持,解决信息孤岛等问题。

[1]许哲军,大数据环境下的高校科研管理信息化探索[J]. 技术与创新管理,2014,2(35):112-114.

[2]郭卜铭,高校科研管理中的数据挖掘技术及应用[J].科技与产业,2007,6(7):38-40.

[3]王鸣,科研管理信息系统的数据挖掘应用探讨[J].琼州学院学报,2014,2(20):152-153.

[4]郭卜铭,高校科研管理中的数据挖掘技术及应用[J].科技与产业,2007,6(7):38-41.

[5]查东辉,数据挖掘在高校教务及科研管理中的应用[J].科技管理研究,2009,4:109-110.

[6]徐守军,数据挖掘技术在科研管理中应用前景初探[J].中学医学科研管理杂志,2005,4(18),214-216.

Design of Scientific Research Management System Based on Data Mining Under Big Data Environment

Liu Zhanbo, Wang Liwei, Wang Xiaoli
(Mudanjiang Medical University, Mudanjiang, 157011)

This paper briefly analyzes the present situation of scientific research management in universities, introduces the big data and data mining technology, and presents the design scheme of university scientific research management system under the environment of big data.

Scientific research management; Big data; Data mining

牡丹江市科学技术计划项目(Z2015g0001);黑龙江省学位与研究生教育教学改革研究项目(JGXM_HLJ_2015136);牡丹江医学院科学技术研究项目(ZS201503)。

猜你喜欢
数据挖掘管理系统模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
基于James的院内邮件管理系统的实现
探讨人工智能与数据挖掘发展趋势
基于LED联动显示的违停管理系统
海盾压载水管理系统
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于RFID的仓储管理系统实现
基于GPGPU的离散数据挖掘研究