吴娜 王媛
【摘要】高校管理决策支持的宗旨是辅助管理者作出合理、科学的决策。高校档案记载着丰富的教学、科研和管理信息,是高校历史真实、全面的反映,是规范管理的基础。本文研究如何挖掘档案数据价值,为高校管理决策支持服务。
【关键词】高校管理;决策支持;档案;数据挖掘
高校管理是对学校教育、教学、科研、后勤和师生员工等各项工作进行计划、组织、协调和控制的活动。通过管理,把各项工作及其组成要素结合起来,发挥整体功能,以实现其对学生的培养目标和各项工作目标。高校管理决策是高校管理的基础和行为指南,决策的合理性、科学性对高校管理工作是至关重要的。
一、高校管理决策支持的特点和优势
高校管理决策支持的宗旨是辅助高校管理者作出合理、科学的决策,而非代替管理者作决策。高校管理科学化就是高校管理层在制定决策和执行决策的过程中,运用科学的管理理论和大量的基础数据,做出可行的、合理的决策。
高校管理决策支持是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的应用。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,辅助解决各类决策问题,帮助决策者提高决策水平和质量。
随着数据仓库(Data Warehouse,DW)、联机分析处理(On-Line Analysis Processing,OLAP)和数据挖掘(Data Mining,DM)新技术的出现,DW+OLAP+DM逐渐形成决策支持的新概念,其特点是从数据中获取辅助决策信息和知识,实现更有效的辅助决策。
二、高校档案数据的特点和价值
信息性是档案本质属性中一项重要属性,档案具有“信息价值”。数据是信息世界的基础性资源,从数据层面来挖掘档案的价值,我们会发现档案的“数据价值”。档案的“数据价值”为档案工作创新实践提供了指引,档案信息化的最终目的是挖掘档案的数据价值。
高校档案记载着丰富的教学、科研和管理信息,是高校历史真实、全面的反映,是规范管理的基础,是积累和传播知识、经验等的重要载体,是文化建设的重要素材,是宝贵的历史记忆。从时效性来看,档案数据都属于静态数据,有定性和定量两个特点。定性数据表示数据对象的抽象特征,如取得圆满成功、得到了進一步发展等。定量数据反映数据对象的具体数量特征,如在校生数、招生数、职工数、发文数等。通过高校档案数据挖掘,可以为高校决策提供科学的依据,加强高校管理决策的合理性和科学性。
三、基于高校管理决策支持的档案数据挖掘
提高决策的科学化、民主化水平,是实践科学发展观的先决条件。国家档案局多次提出要加强档案信息资源体系建设,将“档案库”变成“思想库”,努力成为服务领导决策的重要参谋和助手。高等学校肩负着人才培养、科学研究、社会服务、文化传承创新、国际交流合作的重要使命。要让高校档案成为高校管理的思想库和资源库,更好地实现高校管理决策支持。
如何将“档案库”变成“思想库”,笔者认为可以通过档案数据挖掘来实现。档案数据挖掘是从大量的、模糊的、随机的档案数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,可通过以下流程来实现。
(一)业务理解。本阶段的主要任务是把高校管理的目标需求转化为档案数据问题的定义和实现这些目标的初步计划,并确定对档案数据挖掘结果进行评价的标准。1.确定目标。数据挖掘分析人员从高校管理决策支持角度全面理解用户的问题,发现其真实需求,清晰明确地定义用户的目标和成功的标准。2.形势评估。详细了解用户所具有的档案资源、需求、假定和限制等因素,为下一步确定数据挖掘目标和制定项目实施计划做准备。3.确定数据挖掘目标并制定数据挖掘成功标准。例如,一个业务目标是“合理设置各专业招生人数”,其相应的数据挖掘目标是“对过去五年的各专业招生人数和就业率进行分析,预测招生人数”。4.制定实施计划。制定完成数据挖掘任务的项目计划,包括项目执行的阶段,每阶段时间,所需的资源、工具等。
(二)数据理解。本阶段的主要任务是完成对档案数据资源的认识和清理,是数据处理的核心。主要包括下面几个方面。1.数据的初步收集。数据初步收集的内容包括数据源、存储方式、表数、记录数、字段数、使用限制等多方面。2.数据描述。从总体上描述所获得数据的属性,包括数据格式、数据质量、数据出处、收集时间频度等多方面,并检查数据是否能够满足相关要求。3.数据的探索性分析。包括关键属性分布、属性之间的关系、数据简单的统计结果、重要子集的属性和简单的统计分析等,这些分析可能直接达到了某些数据挖掘目标,也可能丰富或细化数据描述和质量报告,或者为将来的数据转换和其他数据处理工作做准备。4.数据质量检验。检验数据是否满足数据挖掘的要求,如数据是否完整;是否具有缺失性和缺失属性。
(三)数据准备。此步骤同样是数据处理的核心,是建立模型之前的最后一步,其任务是将原始档案数据转化为适合数据挖掘工具处理的目标数据,主要包括下列步骤:1.选择数据。制定数据进入、剔除的标准,决定分析所要用到的数据。2.数据清洗。保证数据值的准确性和一致性,解决数据缺失问题,将数据质量提高到能满足分析精度的要求。3.数据构建。通过一个或几个已有属性构建新的属性数据。4.数据整合。将来自不同表或记录的数据合并起来以产生新的纪录或属性值,涉及对冲突和不一致的数据进行一致化。5.数据格式化。对数据进行语法上的修改,以满足建模的需求。
(四)建立模型。选择和应用多种不同的数据挖掘技术,调整它们的参数使其达到最优值。同一个问题,会有很多种可以使用的数据挖掘技术,但每一种挖掘技术对数据有不同的限制及要求,就需要回到数据准备阶段重新进行数据的选择、清洗、转换等活动。该阶段主要包括下列步骤:1.选择建模技术。了解相应的建模技术的特点及该技术对数据的假定要求。2.生成检验设计。分析如何对模型的效果进行检验。3.建立模型。设定模型参数,在备好的数据集上建立模型,记录和描述构建的模型。4.评估模型。包括根据数据挖掘的成功标准评价模型的使用和模型参数的调整。
(五)模型评估。由业务人员和领域专家从业务角度全面评价所得到的模型,确定模型是否达到业务目标,最终作出是否应用数据挖掘结果的决策,主要包括下列步骤:1.评估结果。评估产生的数据挖掘模型满足业务目标的程度,筛选出被认可的数据挖掘模型。2.数据挖掘过程回顾。查找数据挖掘过程中是否存在疏忽和遗漏之处。3.确定下一步。列出所有可能的行动方案,根据评估结果和数据挖掘过程回顾,确定项目下一步如何进行。
(六)发布。发布是运用数据挖掘结果解决现实业务问题,实现数据挖掘的价值。主要包括计划实施、计划监测和维护、生成最终报告、项目回顾。
高校档案记载着丰富的教学、科研和管理信息,本文从高校档案的“数据价值”出发,探讨如何把数据挖掘技术应用于档案数据价值发现,最终为高校管理提供决策支持。
【参考文献】
[1]郑金月.数据价值:大数据时代档案价值的新发现[J].浙江档案,2015(12):11-14.
[2]石路,冯贤杰.档案资政:服务决策的重要方式[J].中国档案,2012(04):28-29.