李亚兰 金 璐 付赵震
1.北京电子科技学院,北京市 100070
2.中国政法大学马克思主义学院,北京市 100088
2017 年12 月8 日,中共中央政治局就实施国家大数据战略进行第二次集体学习,中共中央总书记习近平在主持学习时强调,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好地服务我国经济社会发展和人民生活改善。[1]大数据时代的到来改变了人们日常的生活方式,特别是思考问题的逻辑方式。 对于高校的思想政治工作而言,传统的教育方法受到了前所未有的冲击,高校思想政治教育作为引导和改变主体价值观的一种教育方式,它的存在范式面临着重新的定义。 思想政治教育的理论范式本质上就是思想政治教育的问题域,强调思想政治教育研究什么、具备什么功能、目的是什么。虽然大数据的出现在这些基本的问题域中没有产生实质性的改变,但是在方法论上,大数据彻底地重构了高校思想政治教育的发展逻辑。 大数据时代的到来为提高大学生思想政治教育工作效果提供了机遇,在有利于学生成长和安全的条件下如何抓取和运用大学生的海量数据也为大学生思想政治教育工作提出了挑战。
大数据本身是一个数据系统,与思想政治教育结合后,大数据能够感测到完整的教育活动过程,通过搜集和分析相关数据,将这些活动的数据形象地表现出来。 通过大数据的叙述方式,以往的教育事件的阐释更加具有真实性,学生在掌握新的教学内容时可以预先通过数据感受到相关理论为社会带来的影响和变化,这是因为大数据自身带有全息性。 思想政治教育大数据的发展拥有很多属性和功能,若想彻底理解思想政治教育大数据的本质,首先需要弄清楚它的特点。
从特点上看,大数据首先拓宽了教育的覆盖面。 教育大数据将现实中所有的数据整合成为自己的教育内容,学生们通过这种方式所获得的教育信息涉及社会发展的各个层面;这种学习方式拓宽了学生的视野,也提高了学生们对知识质量的要求。 与传统的思想政治教育形式相比,大数据时代下的思想政治教育可以精准地对每一位学生进行思想输出并统计每一位学生的学习心理、学习行为以及受益程度,通过管理者对教育数据的分析,可以客观的、真实地呈现教学效果。 二是突出学生们的主体性。 每一个大学生的思维模式都有着自身的特点,教学过程中全息景象的提取可以让教师和管理者为不同的学生制定不同的教学方案,不断细化、量化教育标准,最终分析并掌握每个学生的学习偏好。 三是要求教学内容数据化。 大数据时代从某种程度上来说就是一个强调精准和量化的时代,教学内容不再像以往多数用“好”与“坏”等单一思维模式可以解释,而是通过具体的数据和模型还原教学内容本身的历史发展过程。 在这一特点的影响下,高校思想政治教育从定性的教育方式发展成为了定量的教育方式;从片面地追求教育结果发展成为全面地呈现历史过程。 从这些特点来看,大数据与思想政治教育的融合突出了思想政治教育的实效性、常规性、决策性、应用性等方面。思想政治教育领域中的大数据多数来自于教师们和学生们的日常生活,客观有效地反映了现实中师生交往活动、学生自我认同等心理发展过程与价值取向的生成过程。
大数据从功能上看,第一,丰富了思想政治教育的教学方式。 随着物联网、云计算、社交平台的发展,手机、电脑、可穿戴的移动设备已经成为广大教师和学生们的热衷产品,通过网络信息技术,思想政治教育的资源可以实现无障碍的传播,教育的形式也不再像以前那样单调,实现了寓教于乐的教学理念。 通过智能教育模式,每个教育者和学习者都能寻找出最优的教育路径与学习方法,整合自己的数据资源,规划未来的发展方向。 第二,提高了思想政治教育的针对性。通过大数据的分析可以发现学生们关注的焦点问题,可以具有针对性地研究某些学生群体的心理和行为。 第三,提升了思想政治教育工作者的素质。 通过学习和使用大数据的监管科技,思想教育人员的自身修养也得到了大幅度的素质,教师通过数据科技可以定向地优化校园内的网络资源,破除思想政治教育资源碎片化的困境,促进校园数据的应用更加开放、更加优质化。 第四,推动了思想政治教育的科学发展。 通过现实的社会数据让学生们体验到日常生活的发展过程,便捷的数据提取为思想政治教育的逻辑和理论提供了充足的案例支撑。 大数据并不是单一的数据科学,它还是一种价值观和方法论,通过数据引导,有助于学习者重新认识日常的生活世界,实现自我学习、自我教育的观念。
大数据与思想政治教育的结合突破了传统的教学方法,将被动的思想政治灌输转变成学生主动地自我教育。
第一,大数据与思想政治教育的融合要求以实时分析学生心理动向,引领舆论导向。 大数据时代所带来的新问题必定需要在大数据的生态中才能得到有效地解决。 这要求高校管理者能够将学校的发展与大数据产业的发展潮流相互融合,用大数据自身的治理方法,解决学生们的日常困惑。 当今的大学生都在通过各种文字、图片、语音、视频的方式抒发内心的感觉,这些文件都是以数据的形式在网络中进行传播,大数据的科技可以有效地对这些文本进行分析,从而起到预警的作用,可以避免校园舆论危机的发生。 例如2016 年5 月,法国巴黎综合理工学院在自己的校园网络中进行数据分析时,发现当时具有伊斯兰信仰的学生在校园网络里留言比较激烈、极端,并有组织集会的倾向,学校便针对特殊群体和个人开展了心理疏导工作,确保了学校日常工作的正常开展。[2]
第二,大数据与思想政治教育的融合要求提高思想政治教育工作者的科技能力。 在大数据的环境下,网络思想政治教育工作的开展已经成为必然的发展趋势,面对网络上繁杂的信息,大学生将会不知如何分辨、如何评价。 作为思想政治教育工作者,应该具有即时监控校园热点话题的能力,通过校园BBS、网络博客、微信平台等多种方式进行解释和解答。 这种教育方式要求思想政治教育者自身有着较高的政治敏感性和舆情敏锐度,并且能够运用科技的手段将自己的思想传播到学生当中去。 例如美国哈佛大学、耶鲁大学近几年正在联合培养智能校园建设的大数据人才,以数据挖掘、数据分析、数据可视化为基本培养内容孵化数据创新人才。 这些新型的人才主要来自于自愿接受教育的大学行政工作者,顺利通过考核后,他们将在两校联合的智能校园中心进行数据分析工作。[3]
第三,大数据与思想政治教育的融合要求突出预测作用在思想政治教育中的应用。 大数据的重要功能之一就是科学预测,比较有名的案例是谷歌公司通过对网络词条的获取和分析预测了流行感冒的爆发。 学校的思想政治教育教师与相关科技研究人员应把握大数据的这一现有的优势,研发相关的智能产品或数据模型,通过数据预测,让思想政治教育的影响力更加广泛、更加深入。
第四,大数据与思想政治教育的融合要求政、校、企多方面联合,增加有效的数据服务。 现阶段,政府、高校和企业面临着很多共同的问题,学生的培养和进步关涉了整个社会的发展,政、校、企的联合能够有力地突破大学生思想政治发展及日常生活、学习发展的瓶颈。 虽然很多高校自身也是科研机构,拥有高质量的研究所,但是在大数据的某些具体领域,高校研究所的产品研发还是不如社会上某些公司、企业做得优质。 大数据公司可以为高校学生提供教育产品,高校的教学管理也需要这些先进的科技产品,如此,政府便扮演了中间的联系人、担保人,让高校与公司、企业无缝对接。
思想政治教育大数据的核心技术有很多,现阶段流行的有数据库技术、Hadoop 衍生系统技术、自然语言处理技术、社交网络分析技术、信息检索技术、云计算技术等。 以下用数据挖掘技术为例分析大数据与思想政治教育的融合过程。
数据挖掘目的是从大量的、零碎的、有噪声的、模糊的数据中提取出有用的知识和信息。 提取的方法有很多,常用的如神经网络提取法,指的是把某个神经网络划分为不同的层次,每个层次包含了多个节点,这些节点又以此对应不同的变量。 通过分析层次的数量和节点的数量可以估计出该神经网络的复杂程度,预测其发展趋势等。 大数据时代,对思想政治教育相关数据的挖掘和提取要比以往更加深入,数据挖掘的理论和技术都具有一定的难度,它自身融合了数理统计、数据库架构、机器学习等内容。 作为一个普通的思想政治教育大数据分析人员,掌握SAS、SPSS、EXCEL 等日常统计软件已经是比较基础的要求。 但这些基础的技术工具一般用于单一的数据群,对于网络内的海量数据,其挖掘和分析的效果将无法满足现代教育的要求。 从技术性角度而言,若想成为专业的思想政治教育数据分析师还必须掌握一些基础性的编程语言,如C++,Java,Python 等。 此外,如果想有效地通过大数据的手段来挖掘思想政治教育的深层次内容,相关研究人员还需要掌握开发和运行处理大数据的软件平台Hadoop。
图1 大数据分析与处理流程
以Hadoop 为例, 思想政治教育的教师或科研人员可以通过Hadoop 来实现对校园BBS、微博、微信、电子邮件等信息的挖掘。 可以先将挖掘信息的过程划分为四个部分,即数据获取、数据储存、数据挖掘和数据展示。 通过调用服务商所提供的接口(API)或者Web 爬虫等方式来获取信息。 将提取好的海量信息通过Hadoop 的HDFS 来储存,储存系统可以使用两个开源框架搭建(Hadoop、Hive),其中Hadoop 是该系统的基础框架,Hive 则提供SQL 语句的数据查询。做好前两项基本工作后便可对数据进行挖掘,通常采用并行的处理方法,将数据划分为多个子块后进行Aprior 算法处理,将结果合并到一起,最后把所得结果用Web 页面展现出来。 这种数据挖掘的效果好坏取决于研究者对数据分词处理的能力。 大学生在讨论热点问题时总会生成一些出现频率高,使用范围广的特征词汇,这些特征词汇就是数据挖掘所需要的词源。 一般情况下,对于没有超过3 个中文字的字符串可以直接放置在数据库的索引词汇中,对于那些超过了4个中文字的字符串则用空格等标点符号分隔开,将其分成多个子查询串。
例如对于“大学生心理变化特点”进行分词时就可以分割成“大学生,心理变化,特点”。 词是语言学上最小的且有意义的单位,英文单词之间天然的用空格作为了分界符,而汉语需要重新为词与词之间的关系做界定。 分词技术在现如今已经非常成熟,常用的分词技术如正向最大匹配法、反向最大匹配法、基于知识理解分词法等。这两种方法都是应用词典匹配的方法进行分词,将词典中所有的词汇按照由长到短的顺序在所需要研究的数据中搜索一遍。 或者是将需要分析的字符串与一个相关语料库或机器词典中的词条进行匹配,若匹配成功则识别出一个词。 后一种方法则是强调每一句中切出的次数最小,是在前一种方法的基础上又做了一次统计和分割,强调在语法、句法、语义的分析上统计词语使用的频度,并对获得的有关词汇是否具有歧义进行判断。
分词技术是数据挖掘过程中常用的技术方法,这是因为大量的思想政治教育相关数据都是以文本的形式存在于网络中,而类似于校园视频等大学生们时常分享的视听文件,通过信息技术的转化也可以文本的形式来分析。 从技术逻辑与思想政治教育的发展逻辑双向来分析,可以看出思想政治教育大数据更深层次的逻辑发展规律。 在数据科技的引导下,思想政治教育的判断逻辑从注重“流程”转变到了注重“数据”上来。思想政治教育本身也面临着非结构化数据的问题,日常生活中的突发事件、紧急事件、领导的即兴的发言等随机发生的事件都会为教师和学生带来碎片化的知识。 以往大学生在校内课堂所接受的知识都是连续性的,这种随机性的知识打破了学生们接受知识,理解社会的顺序,若想充分理解这些碎片化的知识信息,不受其片面性的影响,教师和学生必须采用大数据的认知方式来弥补自己对随机性、碎片化、片面性知识认识的不足。 大数据的认知方式强调“数据”的实证性与推演性的作用,教师与学生们的历史性教学互动模式将在大数据的引导下增加更多的结构属性。 信息的连续性、历史性尤其是其因果关系在数据科学的分析中被淡化,而信息的功能、信息与知识之间的转变方式、信息的流动变化过程则日益凸显出来。 通过对数据生态的把握,思想政治教育的研究者可以忽略信息的历史发展过程,在数据生态中将现有数据信息与生态结构的功能相匹配便可以获得新的信息和知识,思想政治理论研究也因此得到创新和发展。
在牢牢把握正确舆论导向、适应新形势发展要求的同时,高校思想政治教育工作需要进一步创新,这种创新既要体现在战略上,又要体现在行动上。 思想政治教育与数据科学的融合本身就是一种创新,但这种创新在近几年的发展中一直处于形式上的发展阶段,在实质上取得的成绩依然不能体现出我国思想政治教育事业的优越性。
思想政治教育大数据的创新有很多基本要求,数据样本的统计要比以往更加全面,至少已经不是传统统计学中的抽样统计方法,而是全部样本的统计;这种数据思维要求研究人员要将更多的研究精力投入在数据挖掘领域上。 而与高校思想政治教育工作相关联,则要求学校相关工作人员和科研机构集中精力建设校园个人数据集成系统。 这个系统本质上就是校园里每一个人的个人信息中心。 高校思想政治教育的顺利开展必须要有针对性和现实性,面对不同的人和不同的问题,只有在短时间内全方位地了解教育对象的存在方式、发展逻辑才能有效地对其进行心理疏导和思想政治教育。 这个个人数据集成应该包括每一个人入校前的社会生活信息和入校后的校园生活信息,除了个人自然情况信息外还应该包括他的日常网络活动踪迹,包括其发表言论的主题、留言的情绪、购物网络和娱乐网络上的偏好选择等。 这种全方位的信息集成将有利于学校监管部门充分认识在校人员的心理活动和表现行为。 所有信息的提取都不是通过调查问卷的形式,而是通过网络跟踪的技术来完成,并且应该将不同的信息归类并细化,把敏感的数据保护起来,或将重要的数据与个人人事档案相连接。 除了建立个人数据集成,高校的思政研究中心还应该建立校园公共服务数据集成。与个人数据集成不同,校园公共服务数据集成主要可以用来分析校园群体的偏好,通过这个数据中心校园管理者可以便捷地抽取校园网络里的公共信息,可以查阅校园内智能电子设备上的遗留数据。
通过在校园内建立多种形式的数据集成中心可以确保高校思想政治教育数据的全面性和完整性。 此外,作为高校思想政治教育本身而言,它的创新发展也需要大数据在相关理论发展领域提供数据支持和案例支持。 高校的思想政治研究人员可以将数据的来源扩大到整个网络,不限制数据产生的时间。 将马克思主义、中国特色社会主义、核心价值体系等理论作为研究对象来提取相关信息,按照不同主题汇总全世界的类似案例,如以英美国家高校如何开展学生爱国主义教育工作为主题总结多个经典案例和方法。或者是以马克思主义理论书籍出版数据为研究对象,统计分析马克思理论在非洲、拉丁美洲的传播路线。 也可以通过大数据的分析展现十八大以来社会主义经济、政治、文化、生态等多方面的变化。 这种紧紧依靠思想政治教育为基础的数据挖掘和分析为高校的思政理论课教育提供了案例,方便教师对理论知识的解释,也有益于学生们对相关知识的理解。
大数据通过最新的挖掘方法汇聚最广泛的数据和通过创新的分析方式考察不同数据之间的关系,呈现出以往被忽视的或尚未被发现的教育资源。 对这些领域来说大数据与高校思想政治教育的融合是有意义的,也是必然的发展趋势,但是在大数据与高校思想政治教育研究的统一中,也有一些问题值得校园管理人员关注,那就是数据伦理道德的问题。 在进行个人数据信息集成的过程中,如何界定个人隐私并将其进行脱敏处理逐渐成为数据操作人员面临的难题。如何不通过触及个人隐私来完成数据分析将成为校园大数据在伦理道德领域发展的方向。 学校的思想工作人员要坚持伦理自治的原则,“不因任何的诱惑而作为或滥用科技手段;认真地思考每一项科技活动的价值意涵与可能的社会后果;审慎地进行可能具有不明确的深远影响的科技活动”。[4]在大数据环境下,用户的大量个人信息数据能够被大数据技术随时随地永久性保存,并可以通过强大的还原性画像功能分析用户的偏好特征与行为倾向。 这种对个人信息的记录、保存以及呈现,很容易引发个人隐私泄露问题。 与此同时,基于网络应用生成的个人数据大多并非用户主动留存,而且从法律层面来看,用户对其数据信息具有知情权、使用权、存储或删除权,平台运营商或网络数据公司收集、兜售用户数据从而产生信息红利本身就存在侵犯用户权利的问题,信息技术的安全漏洞更会导致数据泄露,这为高科技犯罪活动提供了滋生土壤[5]。出于精准变革目的在思政教育中引入大数据技术,应该坚守善行的伦理,尊重学生的隐私,保障信息安全,坚守思政教育初衷。 在现阶段,数据伦理、数据安全、数据权属、数据立法将成为数据科学的热点问题,作为高校思想政治教育人员和科研人员,如何通过大数据的帮助来维护和促进社会的公平正义,保障校园文化的和谐发展,促进教育工作的优质高效将成为一个长期值得关注的话题。