闫志伟 郑 洁 邹佳莹
(合肥工业大学电气与自动化工程学院,安徽 合肥 230009)
大数据的兴起和应用为传统思想政治教育变革提供了新方向、新方法和新模式,运用其特有的方法来研究海量数据信息,通过数据分析得到可以为高校思想政治教育工作所运用的非常有价值的产品和服务,进而推动高校治理体系和治理能力现代化。目前很多高校已经认识到大数据在思想政治教育工作中的优势、作用、价值和应用前景,也作了诸多创见性的理论研究,但在应用实践上有成效、能借鉴、可推广的研究成果不够丰富[1]。因此,如何运用大数据开展思想政治教育的理论研究、学科建设、实践应用等问题有待进一步深入探究。
思想政治教育大数据是大数据的一个子集,特指思想政治教育领域的大数据[2]。文献调研发现,目前还尚未有学者对思想政治教育大数据作出明确的概念界定。所谓思想政治教育大数据,是指整个思想政治教育活动过程中所产生的或者采集到的用于高校思想政治教育理论和实践发展,具有全数据、真数据和隐数据特征,并可创造潜在教育价值的数据集。
在传统的思想政治教育量化研究工作中,由于受到数据处理能力的限制,在面对较多数据量时,往往采用抽样研究,即通过概率论基本原理为实证研究结果进行描述,其本身存在很多缺陷:样本选取有很大偶然性,样本调查忽略细节,这种“局部数据”的分析缺乏延伸性,导致分析结果正确率大大下降。但是,在大数据时代,随着数据存储、数据分析技术的升级,要尽可能收集到更多更全的数据以得到最大化信息,用全体数据取代随机抽样[3]。越是全面的数据越能准确表征事物本身,只有有效地挖掘、分析和利用学生在学校成长发展全过程中的“全数据”,才能全方位、更精准地了解学生所思所想、所作所为,推动高校思想政治教育工作从一体化、整体化转向以具体化、个性化的方式服务于每位学生[4]。
大数据时代,数据是自由、开放和共享的。传统的数据获得方式是在已知的情况或者经过顶层设计后进行的,存在一定的数据诱导,不能完全反映大学生原始真实的思想和状态。数据处理过程多采用“近似”“类比”“推测”等方式,使数据在计算分析的传递过程中逐渐模糊化,导致数据失真,特别是一些非结构化数据的量化缺乏有效标准,使分析结果出现较大偏差。而大数据分析方法是在学生完全不知情或是没有察觉的情况下获取数据,数据多为一手的原始数据,因此这些数据能够最自然、最真实反映学生的思想动态和行为走向,在此基础上进行探讨和分析,最终得出更有说服力更为客观的数据。
大数据时代又称为价值深层挖掘的时代。大学生在校期间的衣食住行,人际交往、情感表达,网络行为等活动会产生许多数据,其中一大部分数据在产生之后不能被直接使用,其价值也就被隐藏起来,特别是一些非结构化数据。随着数据的不断积累和增多,要想从这些数据中发现问题,就要对数据进行深层的分析与挖掘,从中找出事物之间的规律及发展趋势。此外,更多、更杂的数据产生了大量的相关性,通过研究数据彼此之间关联,将会推导出更多的相关性数据甚至是预测出目前未知的“隐藏数据”,这种隐藏的数据往往能够为科学决策和管理提供高价值参考。
高校思想政治教育大数据体现在学生学习生活的方方面面,数据构成复杂体量较大,它所带来的问题不仅仅是存储压力,更多的是庞大的数据没办法使用。从数据产生角度上,学生在校期间学习、生活所产生的大量静态数据,零散地存储在各个部门或者个人的电脑终端,并未形成数据体系;在网络系统上体量更大动态信息,大部分留存腾讯QQ、微信、校外论坛、游戏、支付宝等非学校监管的平台上,由于信息壁垒缘故无法全面统一搜集管理和有效使用。从数据技术角度,学生每天通过文本、日志、图像、网络痕迹等活动留存的数据是十分庞大的,运用这些海量数据需要有成熟的技术支撑,高校当前普遍缺乏有效手段应对数据存储技术、计算机硬件处理能力、数据分析与结果可视化、兼容性等诸多方面的挑战。从数据质量角度上,高校思想政治教育数据存在着多源头、不一致、异构、缺失、不准确、重复等问题[5],会导致大部分“大数据”没有价值,不能有效使用。
通过大数据收集学生的“全体”数据,预测出大学生当前的思想动态和行为习惯,针对可能出现的问题给出有针对性引导,是新时期高校思想政治教育工作的重要内容。但是,怎样收集数据,怎样在繁杂纷乱的数据中找出适用的数据,怎样构建数据和思想之间的相关关系等一系列技术性难题,都是思想政治教育者所无法回避的技术性挑战。高校里传统的思想政治教育者都有着良好的理论基础和过硬的政治素养,但往往缺乏运用“大数据”的意识和能力,而掌握大数据相关技术的专业人员并未参与到高校思想政治教育当中,尚未找到大数据技术与思想政治教育的结合点,无法将大数据技术和相关程序运用到思想政治教育实际工作中[6]。目前解决大数据问题常用的Hadoop方法仍然有不成熟的地方,在高校范围内实施难度较大。因此,如何实现思想政治教育与“大数据”技术的深度融合,是一个富有挑战性的难题。
大数据在高校思想政治教育中的应用对创新和改进思想政治教育模式提供了新的选择。但是,大数据的广泛应用尚未成熟,具有许多不可估测、显性或隐性的风险。在技术上,高校大数据处理的硬件水平偏低,在数据存储拷贝过程中存在丢失风险,在数据挖掘中存在越界风险。在内容上,大数据挖掘基于“全数据”,数据本身真实性、准确性都是不能确保的,加之大数据与思想政治教育相关性研究依旧薄弱,在此基础上分析的结果可靠性是无法保障的,进而导致决策失误。在安全上,这种运用大数据了解大学生思想动态的方式,有可能威胁到学生的个人隐私,使学生透明地呈现出来,引发学生自我保护不“敢”再发出真实信息,出现“信息屏蔽”或“信息流失”。此外,学生的信息和数据是一种资源,能否保证完全不被泄露,或者被另有所图的人二次利用,仍然存在很大挑战[6]。
大数据就是越大越有价值,当前由于普遍缺乏数据收集和管理意识,高校真正所掌握的数据体量远远不够,数据质量较差。学校应当加大政策设计、硬件技术和专项资金的投入,着力构建“校园数据公地”,将散落存储于学校各部门或者个人终端的数据通过统一格式进行收集和管理,提升思想政治教育工作者的数据共享意识,使数据能够在“市场”中流通起来,建设统一的数据中心和管理平台,实现“数据的联通与共享”,同时做好数据容灾备份。
当前大学生生活学习产生大部分数据,留存在了公共网络当中,包括文本、视频、声音、浏览痕迹等,往往这些信息对开展大学生思想政治教育有着十分重要的参考作用,而由于数据保护,这些学生首发的、真实的数据并不能被高校所利用。因此,高校应当加快数字化校园建设,将学生真实的思想动态和行为轨迹等数据引流到学校能够管控的范围之内。提升校园数据生产平台的利用率,例如丰富校园信息门户网站的功能,将学校各个部门和全体学生的部分数据信息高度集成[7]。分类建设校园互动交流网络平台,例如建立网络课程及评价平台、BBS生活交流平台、个性化学习平台等获取学生生活学习相关的有效数据。拓展校园一卡通的功能,包括学习成绩、能力素质、上网习惯、图书借阅、就餐情况、第二课堂跟踪、体育医疗等。加强与校外媒体和官方合作,通过有效途径获取诸如腾讯、百度、阿里巴巴等互联网企业所掌握的思想政治教育大数据。
当前大数据在社会经济领域已经得到广泛使用,并产生了巨大的经济和社会效益,但是在高校思想政治教育领域的应用仍旧缺乏成型方案,“重建设,轻应用”问题依旧突出。虽然高校在教学、管理、服务等方面也已经开始尝试使用大数据技术为思想政治教育工作提供依据,但是分析大学生思想动态和行为趋向的仍旧缺乏有效手段。因此,高校应当逐步建立数据综合分析与应用体系,对已经掌握的学生在校期间产生的结构化数据、半结构化数据以及非结构化数据,进行管理、关联、建模、分析、转化,并从中提取新的深刻见解[8]。开拓视野,开展大数据领域方面的校企合作,引进一些先进企业的成熟经验和技术手段。组建大数据专门分析研究部门,加强大数据应用的实证分析,着力建立思想政治教育分词分析系统,并建立情感量化方案,运用大数据解释和分析学生的思想和行为,真正将思想政治教育大数据实现从理论研究向实践应用过度。