九江职业大学 朱慧芳 韩东
“中国制造2025”这一政策的发布,在一定程度上将科研提升到和教育事业一样重要的地位,高校教师的科研主动性得到前所未有的提升,各类的科研项目大量涌现与发展,同时,学生在教师的影响下,也参与或独立地开展了科研项目,并做出了相当丰富的研究成果。现阶段,这些海量的研究项目未能得到统一的规划与管理,并且其实用价值也未能得到充分体现。因此,在大数据背景下,综合利用现阶段较为先进的信息技术设计与研究一套科学合理且能实现资源共享的平台,并把这些散落的科研成果加以归集、保存、查询、引用,以提升研究的效率、发现研究的潜在价值。本文将重点围绕大数据背景下高校科研培优平台的研究,简要介绍了大数据技术的概念以及大数据背景下高职科研管理的重要意义,并重点讲述了高职科研培优平台的需求分析以及设计与应用,希望能为大家提供一定的参考价值。
探索世界客观规律的主要方式是通过科学研究而展开,运用科学的技术方法能使人们更加正确的认识与了解客观世界,能改变人们对客观世界的认知意识。任何领域、每一个行业的发展都要求思想的创新与事件的创新,但也离不开传统的科研工作。高校是培育具备充实基础知识与熟练实验能力的高科技人才的主要基地,科研能力的意义具有无可比拟的作用。一方面,系统的科学研究可以增强教师的科研意识、创新教学观念、提高学生知识素质和提高师生心理品质,还可以进一步探讨教育实践中的重大问题和兼顾教师教学的长期发展;另一方面,通过科研精神与意识潜移默化地传播,使学生深度了解现阶段学习的基本规律、科教事业的发展以及社会发展的走向。
从大数据理论来说,它主要指的是在网络技术、信息技术高速发展而延伸的新技术。在实际使用过程中,人们可以通过具体的数据,生成大量资料和数据,从而对其做出科学性、合理化、准确性的判断。就目前情况而言,大数据主要体现了以下三方面的功能。(1)在各种作业条件中都会使用的不同数据。通过大数据,便能够从相对繁杂的数据系统中迅速抽取出大量有用数据,以便于为后期的作业顺利开展提供有利条件;(2)对有效数据的管理与解读。在常规数据处理工作中,由于各方面操作通常都会花费大量时间,而且其产生效益也相对低下,显然,这是传统信息处理技术所无可比拟的优越性;(3)该技术的迅速使用与普及对其他信息技术的开发也带来了积极影响。就其优势而言,信息量大、准确性好、信息资源密度相对较高等已经形成了它能够在市场上获得广泛的优势。将这些资源与行业的需要加以充分融合,才能提高效率。在今后工作中,有关部门需要充分考虑到大数据分析的优点,对它们加以合理化运用,促进有关事业顺利开展[1]。
在高校开展相关的研究时,相关题目的选择与上报均是极其重要的过程。按照以往的管理理念而言,如果没有相关部门的指导,申报人则会按照自身喜好与以往经验将相关热点作为研究的题目,这在一定程度上阻碍了研究人员的研究方向,并且还容易与他人内容重合,从而使得科研的效益降低。而基于大数据时代,研究人员可以采用相关的网络技术,来保障自身项目的技术支撑,这也在一定程度上提升了科研人员的研究水平。
随着社会科技的进步以及大数据时代的到来,科研人员可借助网络优势,构建一套较为完善、实用且合理的科研管理平台,使其能实现资源收集与共享。目前,虽然我国有诸多的科研成果,但在某些方面仍存在一定的不足,这也是影响高校信息管控的主要因素。海量的科研信息进行处理时,需要投入更多的时间、精力与成本,才能使信息管理得到提升,而学校构建信息管理体制与运作机制,能使学校实现人、机、网三者合一的实用体系,从而推进信息化的发展,形成相互共享、相互依赖的信息管理机制[2]。
近年来,我国学术研究备受各界人士的广泛关注,高校在大数据快速发展的背景下,日益关注科研培优平台的开发与应用,并深化完善了科研管理的监察机制。随着我国网络技术的广泛应用与分析技术的增强,实现了对海量数据的有效比对,高职院校再通过官方的网站对科研成果进行查重,对数学不断地判定更加精准,从而学术抄袭、学术作假行为的发生,以此推动了科研管理监督机制的快速发展与完善。
基于大数据,高校与相关机构的科研领导人采用准确的数据信息来确定科研项目,这在一定程度上提升了我国科研管理的研究速率与整体质量。研究人员采用数据挖掘技术,使得社会公众、企业以及事业单位等部门明确了人才发展的需求,这能帮助相关人员制定更合适的研究主题,能及时了解科研动向,增强科研主题,使研究项目更具科学性与针对性,同时,在大数据时代下,分析技术的运用,能更高效、更便捷地与相关机构建立对接机制,这有助于科研成果的快速转化[3]。
从用户的层面出发,该平台的使用用户一般为学生、教师、校领导以及管理人员这4 类人群。
在平台相关权限的基础下,用户登录系统,浏览院校最新的科研成果,全库查询方式是依照时间、类型、研究人员姓名、课题以及相关关键词等要求排列,对知识点做出评论或提出相应的建议,并且还能在线上进行交流与沟通。
用户登录系统后,可看到学校院级、市级、省级、国家级的最新成果,可收录并继续关注,同时系统还可针对用户的浏览习惯进行大数据挖掘,并主动推荐适合教师浏览习惯的科研成果。在“我的科研”界面,系统会根据日期、课题时间、经费等具体情况进行分析,为用户提供注意事项,督促用户按时按计划地进行。在“我的资料”界面,用户可以根据自身需求进行选择,如课题申请、递交等,并且该界面还能设置其他用户的查阅权限等。在“工作成果”这一界面,用户可以依照选项、时间等多个条件来展示自己所有的研究成果,其内容主要有研究可以的总量、登记以及研究成果的表现状态等[4]。
领导的角色较为独特,系统管理员需要针对领导的层级来设定级别与权限,例如校级领导能从学校的高度来查看学校内所有的研究结果,查看有关数据;相关院系的领导可以根据学院要求在平台发布院系内的通知与公告等。管理系统主要分为如下板块:“全校研究”统计分析全校的科研成果,而且可以根据名字、系别和工作时间予以排序,产生详尽结果;“评估管理”可以采集相关专业数据,为项目评估提供数据参考;“课题审核”这是根据教师所提交的课题进行相应的审核,平台的“课题审核”能对需要审核的课题进行批注、回复、确定是否合格以及确定提交等相关功能;“课题结项”则是针对相关人员所提交的课题成果进行核查与确认,并还能对其进行备注建议与意见;“经费管理”可以提供课题经费精细化管理;“通知公告”则是相关人员、院系或是院校所发布的通告,就相关的研究成果提出相应的指导;“学术评价”则是相关人员所发布学术论文的一系列的检测问题。
其主要负责对操作系统的维护,并享有操作系统等级的权利。管理者和领导不同,管理人员仅拥有技术上的权限,而领导则具备所有人员能够拥有的权限。管理模块中主要包括业务、授权、管理、数据备份、数据恢复、重置密钥等一系列常备的管理权限。
系统中引入了经典的BPM 业务流控系统。其主要过程是将学校或科研流程的多个入口转换为有意义的输入输出过程。一个科学研究的整个生命周期也可以被视为一种完整的科学过程,即一系列以所需的科研成果的产出为主要核心的科学组织行为的总和。在一种完整的科学研究过程中,一般包含了以下6 个基本要素:科研流程目的、科学输入来源、依照一定次序所完成的科研流程、科研活动中双方的协作机制、科研产出成果以及因为整个流程而产生的经济收益等。在功能设计方面,主要包括了提交/申报、评审、执行、评估、实施、审核、发布等节点。
平台设计线路:整体采用Browser/Server 架构,逻辑可分为呈现层、Business Logic Layer、Data Level,系统平台的支撑则是运用Apache+Tomcat+Oracle。
其结构采用了MVC(Model View Controller)的模型,是一门软件设计模式,主要采用了商业逻辑、信息管理和页面展示相互分开的方法来设计管理程序,把庞大的业务逻辑信息集中在某个模块里。用户可以在需求改进和个性化自定义的页面以及与用户互动过程中,不需重复编制商业逻辑,从而缩短编码的周期。MVC 开始是出现在程序中,“M”是指平台中的所有业务模型,“V”是系统用户的接口,“C”则是系统的控制器。本平台使用MVC 的根本目的在于达到M、V 这两个代码的实际分离,使同个程序中呈现出不同的表现状态。
StuClass:学生类逻辑,其中的内容主要包含了学号、入学时间、科研成果等一系列的用户特性,并实现查询组件等多方面的连接。Advice 方式:针对相关研究的知识点做出一系列的评价与建议。Post 方式:与研究人员进行线上的交流与互动。
TeaClass:教师类逻辑,该逻辑中主要涵盖了院系、学科、职称等多个与教师相关的性质,同时也实现了查询组件等多方面的连接。myResearch 方式:可查询与“我”工作相关的课题进度、使用经费与工作期限等。MyDoc 方式:对用户的科研成果进行系统的收集与分析。myWord 方式:根据相关的课题申请书、研究成果以及设定的浏览状态确认是否让用户拥有阅读内容与下载内容的权限等。MyArch 方式:针对任务选项、时间段等来计算“我”在系统中的任务成果,其中还包括了课题研究的总量、等级等多个内容。
LeaderClass:领导类逻辑,拥有教师类的所有逻辑与属性,并且还能实现查询组件等多方面的连接。genRea 方法:平台内容主要包含了姓名、系别等一系列的基础内容,能查阅平台上院校的所有科研成果,并能对其状态进行分析,得出详细的结论。Check 方法:研究课题的审核与批复,能对相关用户所提交的申请书进行审核与批复。Pass 方法:课题结项,对相关用户所提交的研究课题进行全面的审核与批复,并能附加建议与修改意见等。Notice 方法:通知公告,是指面对系统中所有用户通告的发布,对相关人员所做出的科研成果进行分析与总结。Score 方法:依照系统用户所发布的学术论文的领域、期刊级别等多角度进行综合检查,并对其进行系统的评价。
T_Research 成果一览表:收录了名称、基金、项目研究参加单位、项目研究范围、研究成果类型、成果发表刊物、综合评述、详细描述等栏位。desc 可提供图书全文和对科研数据的详细描述,且desc 是blob 字段,可以用来保存更丰富的科研资源,从而实现语义分析和智能搜索。
该平台的相关数据均储存于关系型的数据库之中,可以通过Select 等来实现查询,并且其查询具备高速率,技术实现极为简单,但是此类数据库不能存放其他的结构化标志,例如,在T_Research 技术结果表的desc 文本字段中有个blob 文本字段,如果采用关系型数据库的like检索,就受到了很大的限制。比如,在T_Research 的结果表中的desc 文本字段是blob 字段,那么在该数据库中采用like 进行查询,则会使其受到一定程度的限制。因此,本文在采用blob 技术并结合大数据处理思路,对系统进行了优化处理,从而实现了以上功能。
总而言之,随着我国高等院校科研工作的与时俱进,院校教师的科研状况也产生了大量的数据,按照科研成果的特征,可将其分为学术论文、作品、专利、软著等。上述成果主要是以结构化的信息为核心,但其中也包括了一些部分的非结构化信息。在数据库系统建设的进程中,以MVC 的结构框架,先通过关联的数据库内容,再根据科研成果所提供的具体字段,引入了大数据分析的处理方法,通过语义的最短路径方法,克服了一般关联式数据库的无关联检索的问题,大大提升了用户的检索效果、发现和分析现状的社会意义,同时也减轻了数据录入的压力,有效缓解了数据库系统落地和长期使用上的困难。