徐 帅
(南京艺术学院 信息化建设管理中心,江苏 南京 210013)
大数据环境下艺术院校数据资源的应用研究
徐帅
(南京艺术学院 信息化建设管理中心,江苏 南京 210013)
当今时代,各艺术院校不可避免要与大数据产生交集,这其中既有机遇也有挑战。文章从对大数据的介绍入手,研究并分析了当前高校数据资源的应用现状及问题,并针对艺术院校的特点及存在的不足作了一些研究和分析。
大数据;数据资源;艺术类院校
1.1何为大数据
随着科技的不断发展与进步,无论身处何方,人们都能感受到无处不在的各类数据:网络、新闻、影音视频、社交圈、购物……每时每刻,各种类型的海量数据都会急速产生,并相互交融、相互影响,当你在购物网站选择了某件商品,或在美食平台选择了自己的偏好,你也在为大数据的产生贡献力量。关于大数据,目前很多公司或科研机构都给出了其定义,虽然不能像超级文本标记语言(Hyper Text Markup Language,HTML)一样给出统一的定义,但我们仍能从各类对大数据的描述中窥知一二,大数据是指超过传统的对于数据处理、存储、分析范畴的海量数据的集合,这些数据具有大量、高速、多样性等特点。大数据的应用范围也非常广,从城市的智慧交通系统、配电系统,到各类电商购物、服务平台,再到二手房销售连锁店、超市等等,都可以看到大数据的应用。
1.2为什么我们需要大数据
全世界都在谈论大数据,除了它本身的特点,大数据在处理和解决各类繁杂问题时所表现出的高效率、高精准性也是人们对其越来越重视,越来越依赖的原因。举个例子:某所国内知名的211院校,由于实现了校园内手机近距离无线通信技术(Near Field Communication,NFC)技术,通过手机定位与NFC数据互通,可以迅速地知道学生在学校期间的各类消费、饮食、学习、出勤率、图书借阅等情况,将其与数据中心的各类教务等数据融合并利用大数据挖掘技术进行多路分析,甚至可以了解到学生在某区间内的消费与成绩之间的线性关系。如果没有大数据技术的支撑,让这些数据都分散在各系统内,是无法高效率、高精确性的完成一系列复杂的系统分析的。
2.1大数据环境下高校数据资源的应用的现状
大数据已经不再局限于技术领域,它已经渗透入了生活的方方面面,作为人才培养、科学研究、社会服务、文化传承等社会功能载体的高等学府,自然离不开大数据的应用。高校的数据资源极其符合大数据的特点:(1)Volume(数量),不同于证券公司或银行系统每天数千万甚至更多的顾客交易记录数据,高校的数据资源很大一部分是学科资源,包括各个院系、各个实验室等,还有一部分来自于学生的各项活动;(2)Velocity(速度),早期的互联网时代,数据产生的速度并不快,但大数据到来后,情况变化非常大,以高校的新闻为例,以前的新闻类的数据,通常一天只有几条,现在各高校的门户网站加上公共账号及二级院系的公共账号,发布速度变为每天数十条多则上百条,如果算上学生之间发布的用于朋友间分享的校内见闻,其数据产生速度更是快得惊人。(3)Variety(多样性),高校的各种数据资源有结构化的、非结构化的、文本、各类影音视频等多媒体数据,形式较多,尤其是艺术类院校,各类影音视频等数据还可以细分为不同的专业,比如音乐类、美术类、表演类、设计类等等。(4)Veracity(精确性),很多数据本身就有不确定性,比如:明天的天气,午饭吃什么,尽管如此,这些数据仍然包含宝贵的信息。比如社交网络,每个人交友的不确定性反而可以使用大数据的方式类分析得出这个人的交友习惯和个性等等。除此之外,为了管理数据的不确定性,也可以通过技术和管理手段对数据进行过滤等处理方式从而得到更准确的数据资源。
在我国,随着教育信息化的大发展,很多高校已经构建了自身的云计算平台,逐渐积累了大量的各类数据资源,如学生的学籍信息、选课信息、科研信息、人事信息等等,通过统一身份认证技术和数据中心的支撑,可以在一套系统内访问各类不同的数据资源,比如学生的各中相关信息、教职工的各种相关信息,利用大数据挖掘技术可以将原先孤立的数据资源有机的整合在一起,通过不同维度的分析,得到非常丰富的分析结果,比如:学生每月上网时长的变化和成绩之间的互相联系等。
2.2需要注意的问题
在大数据被广泛接受的时代,高校的各类数据资源也暴露出了一些问题。其中,数据安全是最为明显的。2016年8月大学准新生“徐玉玉案”引起了巨大的社会反响,此案也暴露出了为何这名准大学生的个人信息会被诈骗犯获取这一尖锐问题。此外,还有很多大型网站后台用户数据被盗的案例,导致大量用户的帐户余额丢失或帐户数据信息被不法分子获取。所以,大数据时代,高校的各类数据资源带来很多便利也同时需要关注数据安全问题,制定合理的管理规定,各级系统的应用层也需要根据实际情况进行有机的部署安排,服务器层面无论是采用虚拟机技术还是实体机,都需要考虑到数据安全、病毒防范等因素。总之,只有通过技术手段和非技术手段两种方式并举,才能切实有效的提高大数据实施后的数据安全,避免因信息泄露而引发的悲剧。
除此之外,隐私保护和访问控制也是需要注意的问题。隐私保护是除了数据安全外备受重视的问题。当大数据资源每天铺天盖地的被传播、存储、访问的时候,每个用户自己的上网行为都将被记录下,很多上网行为涉及用户的隐私,因此需要隐私保护。目前大多数高校都建立了数据中心,各类应用系统都被集成在了一个统一的平台上,数据中心的3个基础的支撑平台分别为门户平台、底层数据平台、统一身份认证平台,通过虚拟化技术及“云计算”等技术可以实现各个平台的单点登录和数据互通,那么问题也随之出现,例如在数据中心内会有很多学生及教职工的数据,如果是管理学籍或者教务的老师,访问或查询学生的相关的学籍、成绩等信息是合适的,如果不是负责这方面的老师,则不该有权限访问到所有学生的数据信息;另一方面,如果使用学生账户登录系统后能查询到老师的工资情况、科研信息,这也不合适。这些都涉及用户的隐私,比如学生的成绩、老师的收入、用户的身份证号码等,所以需要针对不同类别的用户,做好访问控制,对访问权限作合理的分级、分类。即使是教师用户,一般普通教职员工与某些特殊岗位的老师的访问权限也是应该不同的,比如专管人事的老师,他们对教职工工资、职称等信息的查询权限应比普通老师要高,专管科研的老师,他们对科研项目的管理权限也应当比其他老师要高。以上均为简单的举例,在实际操作的时候要复杂得多,对于不用的用户组,根据其特性,分配不同的权限,有些用户组还需要向上兼容或向下兼容,甚至采用多种认证技术作为辅助来确保用户权限分配及访问控制的效果,比如:用户名/口令认证、动态口令认证、CA证书认证、智能卡认证、USBKey认证等,这些都需要根据每所高校的实际情况来制定策略,并且在实施及运行的时候不断地优化,以达到令人满意的效果。
艺术院校的数据资源相比于普通综合性院校,数字媒体类的资源较为丰富,尤其是2011年艺术学被提升为第13个学科门类后,各类艺术学数据资源大量的涌现,各所艺术院校也在不遗余力地发展自身的学科数据资源。相比其他学科的数据资源,如动画、影视这一类的数据资源需要占用比传统文本或文档数据资源更多的存储空间和服务器资源。过去在管理这些艺术类的学科资源时往往各个院系各自为政,信息孤岛现象比较明显,大量的服务器资源、存储空间并没有被高效利用,里面的各类学科资源也没有被很好地传播或利用,仅在各院系这样的小圈子内传播或使用。针对这样的情况,作为艺术类院校应尽早打破信息孤岛现象,重新构建自身的数据资源格局,通过不同的层次,不同的维度进行数据碎片整理,借鉴和吸收大数据环境下对数据的综合利用技术,建立有效的数据中心平台,利用底层的数据贯通和“云计算”架构,提升数据的流动速率,提高有价值艺术数据资源的利用率。采用大存储空间虚拟服务器技术,也能较好地解决各个院系数据存储的闲置空间和服务器资源问题,并且可以通过虚拟机容灾备份技术在数据受损或丢失时在最短时间内恢复重要数据资源。各艺术类院校可以根据自身的情况制定一个统一的艺术类数据资源的管理模式,各院系(专业)比如:传媒、设计、音乐等需要建立或扩展学科数据资源时,可以根据学校统一规划进行合理的采购或分配存储空间、服务器资源,这样既能让各种艺术类学科数据资源在一个高效率的整体架构中运行,也能为该艺术类院校节约可观的软、硬件采购资金。
艺术类院校还有一个特点,即对各类门户、应用系统的界面有着自己独到的设计风格,可以根据其自身情况及所长定制开发相应的风格界面,既能增加该系统访客或使用者的体验好感,也能作为该院校对外展示的一面旗帜,并且这面旗帜相比于文字表述,更具感染力。
当然,艺术院校也有着自身的一些不足,比如很多艺术类院校的教师由于专业的原因,对于信息化技术知之甚少,对于大数据环境的体会也不深刻,他们本身对于技术的发展和变化并不太在意,所以对于很多新技术、新平台的启用,他们也不是非常配合或不能较快掌握。针对这样的情况,各艺术类院校应加强宣传,对于新推出的系统或者平台应考虑到这部分教师的实际情况,多开展相应的培训以及辅导。对于很多如舞蹈、音乐、绘画等专业的学生,也有着相似的问题,同样需要各院校重视,并定期开展相应的宣传和培训,这样,不仅从技术上实现了大数据环境下的各类艺术资源的高效利用,也在用户层面推进了各应用系统的普及使用,这样才能真正意义上实现教育信息化大发展。
大数据带给了我们机遇,提供了各种便利,让高校的各类数据资源获得爆发式的增长和积累,也让我们可以通过大数据技术得到比过去更快更准确的分析结果。同时,大数据也带给我们诸多挑战,比如数据安全、隐私保护等,各高校尤其是艺术类院校应合理利用大数据带来的各种便利,发挥自身所长,建设、积累自身的优质数据资源,同时注意避免各种风险,做好技术与非技术层面的安全管理,迎接机遇和挑战,在信息化建设的道路上越走越好。
[1]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013(6):1125-1138.
[2] 冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014(1):246-258.
[3](英)维克托·迈尔·舍恩伯格,(英)肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
Research on data resources application of art colleges among big data environment
Xu Shuai (Information Construction and Management Center of Nanjing University of the Arts, Nanjing 210013, China)
Nowadays, every art college has connection with big data unavoidably, there are chances and challenges. This paper introduced big data firstly, and then studied and analyzed current situation and problems of application of data resources in colleges, and also did some research and analysis on features and defects of art colleges.
big data; data resources; art colleges
南京艺术学院校级科研项目;项目名称:大数据在艺术院校学科资源库中的应用研究;项目编号:XJ2014028。
徐帅(1981— ),男,江苏南京,教师,硕士,工程师;研究方向:信息化,计算机及网络技术。