张坤
摘要:在数据统计过程中出现的“数出多门”现象,导致孤立数据间的信息壁垒和数据使用者对数据理解的偏差,给统计工作的准确性、数据质量的提高带来巨大障碍。文章设计构建了动态台账管理系统数据库,其可直接抓取教育厅台账系统所需全部字段数据,从而更加方便快捷精准地提取各项统计数据,有效解决数据来源“数出多门”的问题,从源头做到“一数一源”“一网通办”,为高校的相关职能部门真正做到资源共享,加强“统一口径”数据管理,提高数据成果质量奠定了一定基础。
关键词:信息化;统计;管理;数据质量
一、引言
教育事业统计工作是反映教育工作状况、描述工作水平、展示工作成果的重要依据。随着信息技术的迅猛发展,烦琐费时、保存不便的传统纸质台账已不能满足基层统计工作的需要,推广和使用统计电子台账,是教育统计进一步规范统计基础建设,确保统计数据质量,提高统计信息化水平的有效尝试。保证源头统计数据质量是统计电子台账实施的最终目标。鉴于2022年陕西省省教育事业统计管理系统设立并填报基础台账的要求,西安财经大学为配合上级部门工作要求,通过不断摸索探索,结合实际情况、高等教育事业统计要求、每年年底中国共产党党内统计、教育部基层党组织年终统计等要求,省教育事业统计管理系统台账字段的统计要求,以及信息安全数据的相关要求,设计构建了动态台账管理系统数据库。该数据库的建立,可以直接抓取教育厅台账系统所需全部字段数据,方便快捷精准地提取各项统计数据。经过2022年的实践操作与应用,动态台账管理系统数据库帮助西安财经大学在高等教育事业统计工作中节省了大量的时间和精力,极大提高了统计效率和数据抓取正确率,从各个维度全面提高了数据质量,值得推广。
《教育事业统计调查表》是国家教育战略方针制定的根本依据,保证基础数据的真实性、准确性、完整性至关重要。目前,各个高校不同管理部门之间的职能范围不同,统筹管理权限不同,职权之间相互限制,数据之间相互独立,忽视了数据共享,导致海量数据在应用过程中存在“孤岛”现象;各部门获取信息的内容不同,分析手段不同,造成数据录入与维护存在不足,整合与分析不到位,数据处理和平台建设不佳等问题。随着信息技术的迅猛发展,烦琐费时、保存不便的传统纸质台账已不能满足基层统计工作的需要。推广和使用统计电子台账,是统计系统进一步规范统计基础建设、确保统计数据质量、提高统计信息化水平的有效尝试。
二、问题描述
教育统计是一项综合性工作,需要各相关部门共同协作,通力完成。各类统计报表内容存在一定的重复性或填报部门间的交叉性,在数据统计过程中容易出现“数出多门”的现象。例如,在高校教育事业统计中统计“学生及教职工组织关系”这一数据指标,会出现学校人事管理部门、学工部、团委、组织部和教务处等多个职能部门同时填报的情况,相关职能部门如何做到资源共享,解决“数出多门”数据不一致的问题,成为统计人员的核心工作。
鉴于此,西安财经大学设计构建了动态台账管理系统数据库,可以直接抓取教育厅台账系统所需全部字段数据,更加方便、快捷、精准地提取各项统计数据,有效解决数据来源“数出多门”的问题,从源头做到“一数一源”“一网通办”“统一口径”,提高了统计效率和数据质量。
三、解决方案
(一)动态台账管理系统数据库的建设
建设动态台账管理系统数据库的总体目标是省属高校从实践层面上通过建设动态台账管理系统数据库,高质量完成上级部门的工作要求,精准提取所需全口径全字段数据,保障源头数据质量,确保提取数据精准无误。运用统计电子台账的最终目的是提高省属高校统计数据上报质量。
为此,高校可以从两个方面着手。首先,高校根据发展实际需求,优化调整数据指标体系。其次,高校应用多元的数据采集填报方法,搭建灵活的共享数据平台。这些举措可以从源头确保统计数据质量,是建立统计电子台账的最终目标。某高校研发的电子台账,统计工作人员只要求输入原始数据,然后进行汇总程序,就能出台上报数据。因此,原始数据的正确性至关重要,统计人员必须加强搜集源头统计资料,保证其真实性。
高校可以借助动态台账管理系统数据库平台,由职能部门按学年或者月份搜集各分项数据,并上传至平台系统,各部门基于自身权限按需从系统里提取数据。这样可以实现全校共享数据资源,真正做到“一数一源”“一网通办”,有效解决“数出多门”的问题,并且有利于集中进行数据管理和分析,实现数据信息化、智能化,具有共享、高效、便捷、易存储、易校验等优势。同时数据能为高校的管理提供全方位的理论分析及决策支撑等服务。
(二)动态台账管理系统数据库的设计与实现
统计基础信息化是设置统计电子台账的出发点与立足点。不容置疑,统计台账是统计基础的重要组成部分,但传统台账由于依赖手工抄录,效率比较低,统计基础工作未有明显改善。而统计电子台账的引入,不仅强化了“统计基础工作”这一特性,还促进了“信息化”这个特性在基层统计工作中的应用,有利于理顺与原始记录之间、与上报指标之间、与各个部门之间的关系。
(三)动态台账管理系统数据库的应用
本案例研究的动态台账管理系统,设计思路是闭环的。比如,在统计“在校生数”这个字段时,首先,教务处和研究生院负责统计学籍在册的总学生数,形成总体在校生数台账。其次,学生工作部及时更新和维护在校生数总体台账中的学生“休学”“死亡”等异动信息,进一步完善台账。最后,团委和组织部依次对在校生数台账中的“政治面貌”字段进行更新和维护。面向统计和应用需求并对其进行深层次的需求分析,西安财经大学自建动态台账管理系统数据库的总体架构,如图1所示。
以高等学校普通本科生在校生数为例,从某高校自主研发的动态台账管理系统数据库中导出的数据导入教育厅台账系统生成基表3045(高等教育事业统计基表的表号)时,本科生的中共党员数为1 197人,而台账数据库里抓取的人数是1 199,导致基表导入教育部系统中校验出现逻辑错误(系统自动校验中的一种,统计数据系统分为逻辑校验和经验校验两种,前者必须为0才能通过系统上报)。经教务处、组织部、团委等部门反复核查比对,发现数据库中“在校生数”的字段抓取规则与教育厅台账系统不相符。人员类别字段包括毕业、复学、结业、录取未报道、死亡、退学、退役复学、无、休学、延期毕业、应征入伍、招生、招生恢复入学资格,共13种情况。其中,应征入伍和结业,教育厅系统数据抓取规则不算作在校生行列,而台账系统未把这两项单列,导致在校生数与实际情况有出入。经核实,将应征入伍和结业不纳入学校在校生数统计数据后,生成本科生中共党员数为1 197人,导入教育部系统,逻辑校验通过。随后,研究生、成人本科生,成人专科生等一系列“在校生数”产生的逻辑校验问题也都消除了,为解决同类问题节省了大量时间和精力,极大提高了统计效率和数据抓取正确率。
以西安财经大学2021年和2022年教育事业统计工作实际情况为例,形成效果对比如表1所示。
表1 西安财经大学教育事业统计数据提取工作应用
动态台账管理系统前后对比
应用动态台账管理系统前(2021年) 应用动态台账管理系统后(2022年)
人力资源
约束 需要23个部门,40多名基层兼职统计人员,技术人员1名 需要23个部门,23名基层兼职统计人员,技术人员1名
录入到提取数据工作平均响应时间 从接到统计任务起至基层部门统计人员手动录入数据所需时长平均为7天;
基层统计人员人工校准修改并按要求更新维护数据并上传系统,生成基表平均工作时长为7天,平均响应时间为14天 从接到任务起至在系统中更新维护数据,准备好所需数据平均时长为1天;
提取数据形成对应基表并上传至教育部系统审核,生成校验问题拆分反馈给各部门平均时长为1天;各部门回归至系统中核查校准修改源数据并把结果反馈给校总统计平台平均时长为1天。平均响应时间为3天
提取数据出现问题情况 人工比对校验735条 系统经验校验11条
数据质量目标实现情况 满足但效率低,时效性差,质量一般 满足且效率高,时效性好,质量较好
通过以上对比可知,应用动态台账管理系统后,较人工录入数据效率提升较大,提取数据出现问题的情况明显减少,很好地解决了人工录入数据时工作效率低、容易遗漏出错等问题,优化了系统取数规则,大大降低了统计工作的人力、物力及时间成本,提高了统计工作的时效性和效率,从而达到提高数据质量的目的。
四、建议
“数据治理与共享”“大数据”已成为高校信息化建设的大热点,是未来阶段的发展方向。无论是推动高校业务流程再造,还是做好大数据分析支持决策与管理,数据作为所有业务流转和支撑、引领高校发展的核心要素,对其进行标准化建设,实现互通共享是高校信息化发展中的重点任务。高校应挖掘并发挥数据的核心价值,推进高校治理体系和治理能力实现现代化,不断融合各级各类业务系统,切实将“认证一个口,数据一个库,服务一个站”的智慧校园基础建设落到实处。
五、结语
本案例针对在数据统计过程中出现的“数出多门”现象,导致孤立数据间的信息壁垒和数据使用者对数据理解的偏差,统计工作的准确性、数据质量均难以保证等痛点,设计构建了动态台账管理系统数据库。该数据库的建立,可以直接抓取教育厅台账系统所需全部字段数据,有效解决了数据来源“数出多门”的问题,从源头做到“一数一源”“一网通办”,为高校的相关职能部门真正做到资源共享,加强“统一口径”数据管理,提高数据成果质量奠定了一定基础。
参考文献:
[1]叶超.基于数据挖掘技术的学生管理数据分析:以温州职业技术学院晚归数据为例[J].科技创新与应用,2020(15).
[2]鲁玮.数据挖掘技术在高职学生心理健康数据中的应用研究[D].合肥:安徽大学,2019.
[3]刘譞.基于学生行为的成绩预测模型的研究与应用[D].成都:电子科技大学,2017.
[4]韩存鸽.统计分析及决策树算法在高校就业指导中的应用[J].湖南工业大学学报,2019(5).
[5]张丹.如何应用大数据对高校人事管理模式进行改革[J].科学咨询,2020(10).
[6]王健.大数据背景下高校后勤管理信息化建设探讨[J].公关世界,2020(14).
基金项目:陕西省教育厅2022年度教育管理专项科研计划项目“基于高校教育事业统计管理系统校验模块的优化升级研究”,课题编号:22JM008。
(作者单位:西安财经大学发展规划处 )