王佳弘 解博超 张烨青
摘 要:智慧校园建设对数据的精准应用提出了便捷、实用、个性化的新要求。当前高校各部门信息化程度参差不齐,对于人员及其身份的管理模式单一,管理效率滞后。建立智能标签管理系统,管理基础标签,挖掘特征标签,将校内机构、人员、身份进行多维度的标签化管理,能够有效解决上述问题。通过特征标签精确筛选目标群体,可以实现智能推送、师生画像、智能预警等精准服务应用。
关键词:智慧校园;智能标签管理;群体特征;个性化
中图分类号:TP315 文献标志码:A 文章编号:1673-8454(2020)19-0085-05
一、 研究背景与意义
随着智慧校园的普及和数据中心的发展,基于大数据的应用场景与尝试越来越多地出现在高校的教育教学活动中。现有智慧校园应用需求趋向校园服务升级和校园管理转型[1],在真实场景中精准应用数据,为师生提供便捷、实用、个性化的服务,是目前高校信息化建设中的重要落脚点。为使高校资源得到充分利用,建设高校社群管理平台是当务之急。由于高校组织机构复杂、人员身份属性繁多,建立必要的社群管理体系,将机构、人员、身份进行多维度标签化管理,成为数据精准应用的重要前提。
对于上述问题,可以基于高校社群特征,在大数据平台的基础上建设智能标签管理系统。系统以标签的形式对组织机构、人员身份、师生特征等数据进行标记和管理,再通过单维标签或者多维标签的方式,精确筛选出群体特征,进而对其进行消息推送、应用推荐等精准服务。这种方式为解决智能推送、师生画像、智能预警等数据精准应用奠定了坚实的基础。
二、研究现状与不足
校园的信息化建设一般经历四个阶段:基础建设阶段、系统集成阶段、应用集成阶段和信息集成阶段。前三个阶段的建设统称为数字化校园建设,第四阶段则是在此基础上,对学校各系统中的数据进行整合和分析挖掘,为师生提供个性化的服务和决策支持,称为智慧校园建设[2]。我国高校于20世纪80年代开始了信息化建设工作,拥有着极快的发展速度。在发展的过程中,几乎所有高校都经历了数字化校园建设阶段,提高了高校的信息化水平[3]。但在进一步的智慧校园建设过程中还面临着不少瓶颈[4-5]。
1.参差不齐的信息化程度
高校各业务部门的信息化建设和应用程度因各自的发展水平和重视程度而参差不齐。对于数据管理,大致可以分为以下三个层次:第一,有数据平台且与学校数据中心进行数据共享;第二,有数据平台但暂未与学校数据中心进行数据共享;第三,暂无数据平台。处于第一层次的部门信息化程度较高,实时的数据共享可以保证数据的时效性,但处于后两个层次的部门大部分都还只停留在利用电子表格进行下级部门数据信息的统计与上报,造成数据缺乏实时性、准确性,存在信息孤岛,没有跟学校的其他数据共享,导致信息化应用水平受限。
因此,基于高校社群特征,搭建智能标签管理平台,以标签的形式标记和管理机构、身份、特征等数据,实现对高校社群的有效管理,是时代所需。
2.形式单一的管理模式
管理模式的形式单一主要体现在以下两个方面:
第一,很多高校都意识到社群管理这项工作的重要性,因此对校内人员身份进行了详细的划分。然而,仅仅针对人员身份的管理模式太过单一,不能全方位真实地反映人员情况。毕竟人员还有各自的特征,如职级、职称、年级、性别、偏好等。因此,这种模式虽然也能起到一定的管理作用,但不能满足要求,无法解决问题,需要形成完善系统的管理才行。
第二,高校中一些人员的身份,不受所在部门机构管理的约束。例如信息员等,这些身份一方面受本部门管理员的直接管理,另一方面还要受其所属职能部门的管理。各部门的信息员既受本部门院、处、部长的管理,又受学校信息处的管理。传统的人员纵向管理模式过于单一片面,并不能简单地套用在这些身份上。
因此,急需形式多样全面、支持横向管理的新模式。
3.更新滯后的管理效率
高校中的人员变更一般只有人事处和本部门的管理人员知道,其他部门和系统管理员往往无法详细了解全校每一个人的变化情况,只能从校内通知公告或者通过打电话咨询才能了解变动情况。因此,数据更新的滞后大大增加了管理难度与数据的有效性。
因此,基于高校社群特征的智能标签管理平台的数据交互接口,通过对更新频率不同的数据设置各自的同步时间,同步过程中,发现标签有变动情况的,如部门的名称发生变化、部门间产生人事变动等,则会在管理员登录平台后弹出提示框提醒更新,在管理员确认后方可更新标签。不仅能够节省资源,还可以保障数据的准确性与实用性。系统管理员可通过权限设定,将权限下放至各院系、各部门,更能保证人员数据的有效性与准确性。此外,还可通过设置助理的方式,将当前权限完全复制到助理身上,共同管理,以分担工作压力并提高管理效率。
三、智能标签管理平台的架构设计
基于高校社群特征的智能标签管理平台总体框架如图1所示。平台的原始数据来源于人事、教务、学工等业务系统,经用户数据采集、用户数据处理、用户数据标签化以及用户标签管理,完成智能标签管理平台的构建。该平台可为智能推送、学生画像等业务应用提供支撑。
1.用户数据采集
用户数据分为静态用户数据和动态用户数据两类。
(1)静态用户数据采集
静态用户数据来源于学校业务系统,包括人事系统、教务系统、学工系统、研究生系统、科研系统、工会系统、党务系统等,可以获取到用户的基本信息、行政信息、教学信息、科研信息、工会信息和党支部信息等数据。这些数据大多属于结构化数据,不要求实时处理,因此可以通过ETL工具进行数据自动采集,将数据从源数据库经抽取、转换、加载一系列操作至终端数据库。并针对更新频率不同的数据设置各自的同步时间,不仅能够节省资源,还可以保障数据的准确性与实用性。
(2)动态用户数据采集
动态用户数据来源于用户行为,包括网络服务器的用户行为数据、图书馆的用户借还数据、校园卡POS机的消费数据、宿舍教学楼的门禁数据等。这部分数据以非结构化数据为主,其特点为数据量庞大、类别繁杂、更新频率高,因此可采用高可用、高可靠、分布式的海量日志采集、聚合和传输的系统Flume 工具进行采集。
2.用户数据存储
对智能标签管理平台而言,由于历史数据不能轻易删除,数据量会越来越多。因此,需要使用海量分布式文件系统,对大量的数据提供在线服务。同时,根据平台特点,以下三点亦需考虑:首先,对批量数据高速读取的要求较高,但仅仅需要简单的“键—值”读取,没有复杂的连接查询需求;第二,数据库的模式依据标签的动态变化而灵活多变,常有更新列属性或新增列等需求;第三,为便于开发及应用,需要有良好且语义清晰的高级程序语言接口。
基于上述特点,本文选择了Apache HBase这一非关系型分布式数据库存储清洗后的用户数据。HBase是一个稀疏、多维度、排序的映射表,面向列族独立检索,只有简单的插入、查询、删除、清空等操作,不存在复杂的表与表之间的关系。同时,HBase上的数据模型按行键排序存储,读取时会一次读取连续的整块数据,可以保证批量读取的速度。
3.用户数据标签化
构建智能标签管理系统的目的是通过不同维度去描述一个人,认识一个人,了解一个人,其最为核心的任务就是将用户数据进行标签化,并形成用户标签库。用户标签库是根据用户特征、习惯和行为而抽象出来的一个标签化的数据模型,而标签就是通过对用户数据分析而得出的高度精炼的特征标识。目前高校各部门间业务关系复杂,高校社群人员身份多重易变、身份属性繁多,难以管理与使用,因此,本平台将用户标签分为单维标签和多维标签两大类,以便操作。
(1)单维标签
单维标签从“机构—身份”标签和用户基本特征标签两个方面对高校社群用户进行单维度描述。
①“机构—身份”标签
“机构—身份”标签用来描述用户在校内的各类身份信息,本平台根据高校的实际教育教学情况,将身份信息分为行政、教学、科研、工会和党支部五个属性类别。“机构—身份”标签由这五个属性类别下的机构标签与身份标签绑定而得,如表1所示。
②用户基本特征标签
用户基本特征标签用来描述用户的各类基本信息,包括性别、年龄、教育程度、籍贯、教授课程、学生人数、课时量、学生评价、论文、科研项目、横向课题、纵向课题、学术会议、专业领域、研究方向、职级职称、技能证书、阅读偏好、消费偏好、图书借阅、校园卡消费、上网流量、搜索偏好等。
(2)多维标签
多维标签是对单维标签的自由组合,以满足不同目标群体的实际使用需求。根据组合方式的不同,可分为特殊身份标签、公共标签和私有标签三种。
①特殊身份标签
在高校的行政属性中,往往存在一些身份不受所在部门机构管理的限制,例如办公室主任、信息员、资产员、财务员。这些身份一方面受本部门管理员的直接管理,另一方面还要受其所属职能部门的管理。像各部门的财务员既受本部门院、处、部长的管理,又受学校财务处的管理。为此本平台提出一种身份标签跨部门的横向管理机制,打破固有的机构纵向管理壁垒,在各职能部门中设置特殊身份管理员这一身份标签,用来对上述特殊身份进行统一的管理。
②公共标签
为满足高校教育教学工作中的日常使用,本平台预设了一些常用的公共标签,分组合标签和自定义标签两种。
组合标签的设置,不仅涵盖当前用户有使用权限的各类标签,还充分利用与、或、非等多种数据集的逻辑运算符,通过自由组合的方式,来筛选出常用的目标群体,并设置为标签,拥有极高的自由度与灵活性。例如2017级本科生、全校女工委员、35歲以下中层领导等。
自定义标签则有所不同,通过写SQL语句来实现对目标群体的筛选。这种方式虽然需要对数据库的表结构、逻辑关系和字段含义有较为透彻的了解,但却能设置出更具个性化、更具实用价值的标签,大大提升了用户使用过程中的体验。例如2019年硕士学位评审委员会成员等。
③私有标签
在实际的工作中,平台中预设的公共标签可能会出现无法满足用户使用需求日益变化的现象。为进一步提高用户操作满意度,本平台允许用户根据需要设置自己的私有标签。私有标签有两种设置方式:一种与组合标签的设置过程类似,只不过私有标签只有当前操作者能使用,并不对外公开;另一种是先设置好标签名称,然后通过批量导入人员的方式在该标签下面添加用户。
4.用户标签管理
智能标签管理平台在高校社群特征数据的基础上,搭建了一个高度精炼的、标签化的数据标签体系。该平台的功能模块包括标签绑定、标签更新、权限设定、数据查询、消息中心、系统管理。
(1)标签绑定
该功能模块是把已设好的标签绑定到具体的人身上。默认以树形结构呈现标签之间的层级逻辑关系。在进行标签绑定时有两种方式可以选择:一种是通过精确搜索给特定的人员贴标签;另一种是通过导入人员列表批量贴标签。与常规以人为中心、在人身上贴各种标签的方式比,这种以标签体系为中心绑定人的方式,更适用于高校中组织机构相对固定,而人员身份标签多变的特点。
(2)标签更新
标签更新分为管理员手动更新、同步后提示更新两种方式。管理员手动更新是管理员在日常工作中发现平台中的标签结构、标签名称、标签绑定等有缺失或有误时,进行手动更新的一种方式。同步后提示更新是用来针对在同步过程中发现标签有变情况时,例如部门的名称发生变化、部门间产生人事变动等,会在管理员登录平台后弹出提示框提醒更新,在管理员确认后方可更新标签。
(3)权限设定
本平台将权限分为管理权限和使用权限两大类。管理权限用来进行标签绑定和标签更新等操作,使用权限用来设置用户的私有标签和后续发消息等操作。管理员往往无法详细地了解全校每一个人的变化情况,因此通过权限设定,将标签的权限下放至各院系、各部门。具体到某一个人的身上来进行管理,更能保证人员数据的实用性与准确性。除此之外,本平台还可通过设置助理的方式,将当前权限完全复制到自己的助理身上,共同管理以分担工作压力。
(4)数据查询
该功能模块包括用户查询和标签查询两大类。其中,用户查询可根据用户姓名、学(工)号进行查询,结果页面显示的是所查用户的基本信息、被贴的标签、可管理的标签、可使用的标签。标签查询可根据所查标签,显示该标签的从属类别、使用权限、开放人群。
(5)消息中心
该功能模块分为普通用户和管理员两种展现形式。当普通用户发现平台中的标签结构、标签名称、标签绑定有缺失或有误时,可向管理员提交修改申请,提交时需填写问题类别、问题描述和联系方式,由管理员统一进行标签修改。所有的问题可分类管理,管理员既可在消息中心中与用户交互,也可通过用户留下的联系方式交流。
(6)系统管理
该功能模块是本平台运行的基础,用于维护后台用户基本信息及权限角色的管理,保证用户不能跨权限操作。包括用户管理、角色管理和日志管理三个模块。可以添加、删除用户,对指定的用户进行授权,将同类型的用户划归为同一角色,查看所有用户的登录日志。如果灵活度高、自由度大,往往会导致一些安全隐患,因此本平台对职工号进行隐藏保护,只显示最后一位。
四、智能标签管理平台的应用场景
本平台的应用场景包括:消息推送、用户画像、智能预警、个性化推荐以及分析与预测五个部分,如图2所示。
1.消息推送
消息推送系统基于智能标签管理平台,可以根据需求筛选出目标群体,然后进行实时或定时的消息发送。筛选目标群体时,用户不仅能对自己有使用权限的标签进行自由组合,还可通过批量导入的方式得到消息推送的目标群体,有极高的自由度与灵活性。发送消息时,用户还能对消息文本中的字段进行自定义设置,添加附件、图片和回执等,以实现消息的定制推送,满足广泛多样的使用需求。
2.用户画像
用户画像是对现实生活中用户的数学建模。通过分析和挖掘用户尽可能多的数据信息而得,用标签的集合来表示。使用更加直观、更易理解的标签形式,来描述用户或者群组,便于业务的开展和问题的处理,结合用户的信息,整合用户标签,形成用户的360度画像。
高校中支持的用户画像类型包括学生和教师两种。通过学生画像,辅导员、班主任、学院、业务人员等能够更清晰、准确、全面、快速、便捷、理性地了解学生的情况。教师在进行职业发展规划时,最重要的前提就是先了解自己,而教师画像就是一个很好的工具,能够让教师客观地了解自己。它用抽象的数据来描述人物,通过分析挖掘用户尽可能多的数据信息得到的一个虚拟的人物形象,以此来代表个人的背景、需求、喜好等。
3.智能预警
目前高校中已有的预警系统往往只关注学生的学业、家庭困难等单一方面,并不能满足教务处、学工等部门实际工作中的多维需求。在与业务部门进行详细的调研与讨论后,本平台将支持涵盖不在校学生预警、校外住宿预警、逃课行为预警、在籍在校不选课预警、休学退学不离校预警、晚归预警以及上网行为预警七方面的智能预警系统。结合需求,可自行对预警的阈值进行设置与调整。产生预警后,管理人员可根据学生的实际情况,进行预警解除或预警确认的操作,有极高的自由度和实用性,同时也符合高校行业经验。
4.个性化推荐
信息技术和互联网的迅猛发展把我们带进了一个信息过载的时代,海量信息的呈现,一方面增大了用户发现自己感兴趣信息的难度,另一方面也使得大量的信息无法被一般用户获取。个性化推荐是目前解决信息过载问题最有效的工具。个性化推荐在用户画像标签特征和行为智能预警系统的基础上,构建推荐模型,選择推荐算法,推荐感兴趣的信息给用户。例如对于家庭困难的学生,可以推荐一些有关勤工助学岗位申请的信息,通过这种点对点的推荐方式,既可缓解学生的精神压力,也能从一定程度上缓解学生的经济压力。
5.分析与预测
结合用户画像的标签特征和学校教育教学环境,分析学生学习生涯和教师职业发展过程中的方向与目标,并预测是否能达到下一个目标,以及若想达到下一个目标还要进行哪些方面的努力。同时,分析与预测会根据用户的特征变更进行实时的变化,并以数据的方式总结个人的阶段性成果,分析学习生涯和职业发展过程中现实与目标之间的偏差。
五、总结与展望
智能标签管理平台一经推出,就得到了大量师生的广泛关注,师生总体满意度较高。同时,通过多种途径不断了解学校师生的实际需求,将师生关注度高的需求转化为实际应用进行开发,同样取得了良好的效果。目前,已经基于该平台开发了智能消息管理系统,初步实现了高校社群内信息定向精准推送的建设需求。后面将继续扩大智能标签管理平台的适用范围,推广至用户画像、智能预警、个性化推荐以及大数据分析与预测等多个方面,不断扩展服务性能,尝试创新性应用,为师生校园生活带来更丰富的功能体验。
参考文献:
[1]谢幼如,黎佳,邱艺等.教育信息化2.0时代智慧校园建设与研究新发展[J].中国电化教育,2019(5):63-69.
[2]李俊磊.基于数字化校园平台建设智慧校园的研究[J].信息与电脑(理论版),2018(18):235-236.
[3]黄剑.大数据背景下的高校智慧校园建设研究[J].数字技术与应用,2018,36(5):117-118.
[4]李蔚辉.大数据时代高等教育智慧管理浅谈[J].学周刊,2020(9):3-4.
[5]李玉荣.大数据视域下高校智慧校园建设的可行性路径研究[J].信息技术与信息化,2019(8):146-148.
(编辑:王晓明)