顾秀君 张豪成
智慧校园是以物联网为基础的智慧化校园工作、学习和生活一体化环境,以各种应用服务系统为载体,将教学、科研、管理和校园生活进行充分融合。[1]在这种大融合的条件下,信息系统数量和规模不断扩大,各系统之间的独立性造成了用户体验差、信息无法共享等问题,导致信息孤岛问题愈发凸显。因此,有效解决校园信息孤岛问题,成为当前中小学智慧校园建设的当务之急。
信息孤岛从本质上看是由学校信息化过程中信息系统部署时各自为政、缺乏统一规划造成的。因此,最为彻底的解决方法就是把现有的信息系统废止,重新进行系统的规划和设计,建立一个综合型平台。然而,现有的信息系统经过较长时间的使用和磨合,积累了大规模的有效数据,具有较好的适应性和稳定性,重新建设的成本较高。因此,如何低代价实现已有信息系统间的数据融通是中小学校亟待解决的关键问题。基于此,笔者认为可以从以下方面进行突破。
第一,基于数据仓库技术的信息共享策略。在学校实际事务工作中,经常会出现跨应用平台的数据共享不畅问题。如在评定学生的奖助学金时,需要学生的家庭信息、成绩信息、消费信息、考勤信息等作为事实根据,并结合这些数据进行打分。学生的这些信息存放于多个校内应用系统,需要实现这些数据的共享、融合与互通。在目前分模块管理的状态下,直接读写学校内部各信息系统数据库存在一定的安全管理风险,如果操作不当,可能会影响或甚至破坏原有系统的正常运行。那么,建立一个数据备份或者数据缓冲系统,使所需数据从源系统中获取、复制、备份、集中,各信息系统之间间接实现信息共享,这其实就是数据仓库的思想。[2]
数据仓库和数据库可以基于同一数据库系统或软件来实现(如MySQL、MSSQL、DB2 等),但两者建立的目的完全不同。数据库是实际应用系统中的信息存储,是正在使用中的数据;而数据仓库是数据库的一个备份或镜像,本质上是“过期”的数据。这些“过期”数据是根据我们的需求从“正在使用的数据”中抽取并重新组织的,可以来源于各个信息系统,以便综合分析数据、进行决策。本质上来讲,数据仓库就是为信息共享而生的,是实现用户身份数据和应用数据共享的最佳方式。
第二,基于前端数据采集技术的应用数据同步策略。建立数据仓库仅仅是实现信息共享的第一步,最核心的操作是在数据仓库中的数据表中填充实际内容。现在的信息系统大多采用B/S 构架,应用网络爬虫(又称为网页蜘蛛、网络机器人)技术对校园信息系统数据进行集中采集不失为一种便捷、有效的方法。网络爬虫可以按照一定的规则,自动地抓取网页信息的程序或者脚本。它只需要读取和分析数据的前端呈现形式,不受数据的存放格式影响;具备在没有数据字典和文档的情况下直接获取原有信息系统数据的能力,大大降低了数据融通的难度。周期性地调用爬虫对各信息系统进行数据采集,保障了分析决策系统中数据的时效性,在一定程度上实现了数据仓库与校园信息的同步。
第三,基于账户关联和模拟登录技术的单点登录策略。校内各信息系统间要实现融合,形式上还须实现“一次登录、多系统有效”的单点登录功能。为此,我们应该重塑用户身份认证体系,以便能自动取得用户在各个子系统对应的权限。然而,修改各个子系统,废除原有的身份认证系统,统一采用新认证体系授权,其推进难度较大。因此,建立新的认证体系最好不修改各系统原有的认证和登录方式,只要能关联对应权限即可。账户关联的方法并不复杂,只要把各系统中原有的用户授权信息(包括用户名和密码等)统一录入新身份认证体系的对应用户名下。于是,在新身份认证体系中登录,就可以获取到用户在所有子系统里对应的账号和密码。
实现账户关联后,要自动获得对应系统的权限,也就是要能自动登录到各信息系统。由于很多早期开发的系统并未遵循当下的标准授权方式(如OAuth2.0、Basic Auth),技术差异性很大,所以可以选择和采用一些保守型技术手段来解决该问题。比如,桌面客户端形式的模拟登录,这实际上就是用程序来模拟人输入账号、密码,以及鼠标点击登录按钮等操作。
利用数据仓库、前端数据采集以及模拟登录等技术可以有效破解中小学校园信息孤岛问题,对增强系统普适性具有积极意义,在实际应用中能有效节省用户开支,改善用户体验,为大数据决策奠定适用性的管理增值基础。