■ 韦 芳
大数据方法作为一种新兴的科学研究方法,已广泛应用于学界,德育研究领域也不例外。在大数据方法的支持下,德育研究或有全方位变革与系统化创新,实现对学生德育实施过程的数据追踪、德育效果的精准化与全面化评估,并通过对学生思想动态、行为的预测,使德育研究更具针对性与前瞻性。与此同时,大数据方法应用于德育研究的科学性仍存在争议,“数据崇拜”会影响德育研究成果的质量,“数据滥用”则可能使德育研究陷入伦理危机。
大数据方法与已逐渐普及的移动互联网、各种可穿戴设备等相结合,突破了传统研究方法的局限性,给德育研究带来了新的机遇。
精准性虽不是大数据本身的特性,但多维度的海量数据可使大数据方法在与不同学科相结合时,提升研究结果的精准性。大数据“读心术”应用于研究是基于词汇学假设,即“所有的人格特点都会被编码进自然语言中去”[1]。在“无处不网、无时不网、无人不网”的当下,全世界的网民都是数据的生产者。大数据方法使通过社交网站数据判断一个人的心理特质、了解一个人的思想动态、把握一个人的思想趋势成为可能。
德育研究的本质是通过德育过程所呈现的现象,研究人的思想现状、动态、趋势,以期发现规律、利用规律,得出结论并指导德育实践。在传统研究方法中,同每位德育对象开展一对一的交流耗时费力,也很难通过单一主题的访谈或调查问卷把握每位学生的思维方式与心理状态,教育对象的关键性特征与思想细节容易被忽略,“被代表”的情况时有发生。而收集和处理每位德育对象每日产生的数据并进行“精准画像”,在大数据方法中成为现实。大数据方法可以通过不同维度的数据了解德育主体关注什么、讨论什么、需要什么。
从已有的传统研究方法来看,问卷调查法、访谈法等都存在时间上的滞后性,尤其在网络德育研究中,快速获取德育对象思想行为动态的异常波动,如社会新思潮或突发网络舆情对学生的影响,进而做出判断、预估,以便及时干预,是至关重要的。借助网络爬虫技术、话题挖掘技术、云计算技术等大数据方法,德育对象的异常思想动态能被及时查悉。
不同的研究者基于大数据方法,皆能根据需求,快速收集、处理、分析海量数据,从而极大地缩短从数据采集到结果反馈的周期。在传统研究方法中,研究者需要在全部工作结束后进行追忆性质量评价,而大数据则可以使研究者进行即时性质量评价。美国肯塔基大学就曾利用大数据平台,对学生各门课程的成绩、出勤率、使用图书馆设施的记录等各种行为数据进行整合,再通过数据挖掘,快速确认可能存在问题的学生。[2]
简单地说,大数据建模就是指利用相关的计算机技术从大数据中挖掘数据特征,并用量化理论对数据特征关系进行数学化分析,以描述业务需求和模式的一种方法体系。
在德育研究中,大数据方法通过将与人相关的各项数据在一定标准下转化,成为确立模型,在理想条件下实现研究对象具象化。DIKW模型流程图显示,大数据将数据(D)收集,对其进行处理和分析,数据可转变为有逻辑的信息(I),再提炼信息之间的联系,即成为知识(K)。研究者通过机器学习、算法运行等方式进行数据建模,可深挖数据背后所蕴含的价值,大数据的智慧(W)得以发展,最终达到德育研究目标。[3]“大数据可以在一定程度上减少测量误差,提高基于数据资源的研究结果的效度和信度。”[4]暗含着结构特征的大数据方法,提供了一个增强德育研究的客观性与科学性的途径。
大数据方法赋予德育研究以客观性,不仅体现在对研究对象的客观剖析、研究过程的证据支持,还体现在为德育研究结果提供预测价值。舍恩伯格曾指出,预测是大数据的核心。[5]大数据方法视域下的德育研究,包含着面向未来的可能性的分析与预测,有着指引进一步的研究活动甚至是道德教育决策的深远意义。
传统的研究方法习惯于以小见大、以微知著,试图以局部抽样窥见整体。“但囿于‘小数据时代’对复杂性科学研究的局限,只能通过分解、还原、抽样分析等方法进行问题研究。”[6]然而,“不管多完美的抽样技术,抽到的只是总体中的一部分,样本都只是对总体片面的、部分的反映”[7]。
大数据时代的一个转变,即不采用抽样调查法,而用能采集到的所有数据进行分析。当大数据方法应用于德育研究时,或可排除样本与总体之间的差异和样本的选择性偏差,“经过算法处理后的大数据则能更加全面地描绘教育对象的整体特征”[8],得出多维度的、全面的评价结果。结果通过数据可视化图表库Echarts来表现,便于教育对象更加了解自己,也便于德育工作者观测德育实践所起到的效果,对德育的目标制定及实施过程进行相应调整。借助大数据方法,研究者可以从海量数据中发现抽样数据中易被忽略的信息。在信息技术蓬勃发展的今天,大数据方法将推动德育研究范式由静到动、由局部到整体、由线性到扁平、由经验判断到数据研判的转变。
大数据方法为德育研究带来了不同于传统研究方法的新机遇,但随之而来的新挑战,研究者们也不应忽视。
人们的思想活动是德育研究的对象,大数据方法的出现,使思想活动具体化、数字化、精确化成为可能,然而思想活动能否被数据描述、思想状态能否由行为数据来解释、思想趋势能否靠数据预测,关于这些学界仍无法达成共识。
1.思想活动能否被数据描述
有学者提出可将认知神经科学与德育研究相结合,认为对德育效果的评价“可以通过脑电设备测量人脑特定区域的生理变化来获得准确而科学的数据支持”[9]。这使得使用大数据方法描述思想活动成为可能,思想活动所产生的脑电波转化为能为计算机技术所分析处理的数字符号,进而完整刻画人的思想活动。
反对思想活动能被数据描述的学者则认为,以数据来描述思想意识需谨慎和求证,主张大数据方法与德育研究的关联是“建立在思想意识数据化呈现基础上的条件性真理,而非必然性真理,是后验性真理,而非先验性真理”[10]。
从两方观点来看,学界就数据能否对思想活动进行精准描述存在争议。一是鉴于德育研究对象的特殊性与复杂性,思想活动背后的动因、思想生成与发展规律是否能依赖大数据方法得到科学解释,有待实践检验。二是现有技术直接描述人的思想意识动态的能力尚需提高,脑机接口技术成果带来研究方法的突破,然而从生理角度来看,人的大脑的亿万神经元极其精密复杂,能否通过大数据的智能算法、运算能力来描述思想活动的完整过程仍存疑。
2.行为数据能否解释思想状况
行为能否代表思想,思想是否决定行动,思想与行为之间的关系是亘古不衰的研究话题。大数据方法的支持者认为:“大数据技术通过分析人在生活中留下的痕迹再现人的生活,因其能反映人的思想状况而与思想政治教育存在关联。”[11]遵循大数据方法的相关性,使通过研究行为数据探寻思想规律有了线索和方向。
有学者对此表示质疑。一是认为人的思想数据并不一定等同于行为数据。“大数据收集到的各种数据信息,都是人的行为数据信息,而不是人的思想数据信息。”[12]二是从理论逻辑上看,相关关系不是因果关系,因果关系是特殊的相关关系。“大数据体现的是人的行为与行为之间的相关关系,而思想与行为之间是一种因果关系。”[13]
两种分歧仍是指向思想转化为人的行为这一德育难题。大数据方法相比传统研究方法,其数据内容的多样性、数据处理的深度、数据结论的可靠度不言而喻,其中变量间的相关性也的确给予德育研究更多参考价值,但在现有研究应用中,大数据方法并未完全脱离量化研究方法的范畴,“以相关关系为单一路径的研究论证尚显单薄,部分研究者对于研究方法的不信任也就在所难免”[14]。
3.思想趋势能否靠数据预测
“在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。”[15]该观点的支持者认为,数据挖掘更重要的意义在于对“未来思想行为的发展趋势进行预判,做到未雨绸缪,展开相应的针对性、预防性教育”[16]。可以说,依靠数据预测思想趋势,是大数据方法应用于德育研究的应有之义。
反对者的质疑亦有其道理。首先,从行为中能探究思想动机,但难以精准预测。大数据或许能预判人的行为,但“由于大数据方法的缺陷,使其只能应用于对思想趋势的回溯和反思,无法精准预测思想趋势”[17]。其次,大数据方法应用于德育研究缺乏学理支撑,暂未形成系统性思想。最后,目前学界的相关研究虽说取得了丰硕的成果,但大多未能进一步指导实践,关于大数据方法应用于德育研究的实然分析寥寥无几。大数据方法的应然理论与实然分析之间的矛盾尚未解决。
由两种异见可以看出,大数据方法固然为德育研究打开了新的想象空间,但其预测思想趋势的结论往往是在理想条件下得出的,缺乏实践结果的支撑。因此,部分研究者认为,应谨慎看待大数据方法在思想趋势预测中的实际效用。
部分研究盲目利用大数据方法,反而将德育研究技术化、工具化,模糊了德育研究的核心,脱离了自身学科话语体系,存在“贴标签”“喊口号”等“数据崇拜”现象,使德育研究庸俗化。
1.“数据崇拜”模糊德育原理
“德育原理就是研究德育的本质,德育在社会现代化中的作用,德育与人的发展的关系,德育的目标、内容、过程以及如何实施德育等问题。”[18]这一概念是与其他学科相区别的本质属性。但在现有研究中,因过分突出数据、形式大过内容,弱化德育原理的问题初见端倪,进而影响到了人们把握德育研究的内在。“过分追求‘科学’的形式化,即通过要素之间的关系、命题假设去验证和证明某项事物的特殊原理,将一切事务作为客观的、不变的‘物’来看待,通过数据和模型的构建测量出其一般性”[19],反而使研究结论陷入了无法与时俱进的“不科学”状态。大数据方法与德育研究的关系有待明确,谁支撑谁的问题有待厘清与回答。
2.“数据崇拜”易致德育研究空心化
“大数据”概念出现以来,在学界的热度居高不下,各学科领域均试图寻求大数据与学科间的融合之法。但大数据方法并不是“万能钥匙”,在对该方法并未进行充分了解的情况下在研究中强行套用,难免会误用、错用,并最终造成研究内容的空心化、研究方法的标签化、研究结果的形式化。比如,在有些研究中,“大数据”三个字通篇可见,但大部分的观点与结论却是对旧理论的“炒旧饭”,无创新之洞见;有些研究仅将“大数据”中的“大”视为与“小”相对的形容词,未对“大数据”的深刻内涵与基本特性有深入学习。生硬照搬广泛应用于自然科学的大数据方法,有可能会导致对人类社会的误解。是否使用该方法,应根据自身学科属性来判断。
“滥用”即没有限制地过度使用。“数据滥用”现象已愈演愈烈,成为大数据未来发展的关键问题,不少学者由此开始聚焦数据伦理困境。当大数据方法应用于德育研究时,“数据滥用”包括但不限于违规收集个人信息、超范围收集个人信息、收集与研究无关的个人信息等。本应服务于德育研究的大数据若被滥用,则有悖于立德树人,易给德育研究乃至学科声誉抹黑。
1.“数据滥用”或侵犯个人隐私权
“大数据带来的最大伦理危机是个人隐私权问题。”[20]万物智联的时代,在德育研究的过程中个人使用智能设备所产生的各种数据,如访问网页和使用社交软件的记录、发表在社交平台的言论等,皆是大数据的来源。大数据时代的数据采集与以往人工进行的数据采集不同,被采集对象常是不知情的,过去的隐私保护策略都失效了。在数据使用中,“利用计算机强大的处理能力把数据联系起来、信息点连接起来、片段串联起来,从而将一些毫无意义的碎片改造成为一幅幅密集而完整的图画”[21],以往模糊、匿名的信息或被重新挖掘并连接起来。个人隐私权在这个过程中存在被侵犯的风险。
2.“数据滥用”或带来有害预测
预测是依据事物生成、发展的客观规律与应用一定的科学方法对未来事物发展状况进行的科学判断。进行科学预测,需以事物过去、现在相关信息的收集与分析为基础。然而,“大数据预测也可能带来对人权的侵犯,甚至误伤无辜”[22]。
大数据方法的应用对于提升德育预测研究效果的意义重大,但相关研究暂时较少,运用大数据预测功能进行研究的更是凤毛麟角。大数据方法是当下最热门的预测方法之一,然而若将对受教育者行为的预测完全依赖于该方法,以表达对数据及分析结果的崇尚,就是一种滥用。这样的“数据滥用”毫无疑问“损害了人类社会的自由、公平、公正的原则,从而可能侵犯人的基本权利”[23]。
大数据方法为德育研究带来了全新视角与研究范式。同时,大数据方法与其他研究方法一样,并非完美无缺,盲目使用必然影响德育研究的进展。面对挑战,放弃整套大数据研究分析方法绝非上策。我们应不断反思、改进不足,实现德育研究的真正科学化。舍恩伯格对大数据的态度值得我们借鉴:“大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。”[24]