大数据思路下中小学教材使用研究的改进*
——数据收集及处理的多样化

2017-03-06 08:51王班班
中国教育信息化 2017年4期
关键词:研究者教材方法

王 郢,王班班

(武汉大学教育科学研究院,湖北武汉430072)

大数据思路下中小学教材使用研究的改进*
——数据收集及处理的多样化

王 郢,王班班

(武汉大学教育科学研究院,湖北武汉430072)

教材使用研究是教材研究的重要组成部分,它有助于了解教材使用中的问题并提供有益的反馈。研究中所搜集的教材使用行为数据的质量及其处理方式对于研究质量非常重要。现有研究的数据存在来源单一、类型相似、收集处理方法简单等问题,导致研究结果适用范围小,结论呈现静态化、截面化。大数据思路可以为教材使用研究提供新的数据视角。在新的数据观下,数据来源渠道扩展至相关群体的意志行为和潜意识行为;数据类型兼具结构化和非结构化数据;数据获取手段更加直接和多元;数据处理方式将批量处理、实时分析相结合;研究结论适用范围也会有效扩大,呈现方式更为丰富。这都将为教材使用研究带来改进契机。基于大数据思路的教材研究仍需要进一步提高数据的有效性和隐私保护,加强对数据处理方式的研究。

大数据;教材使用行为数据;教材使用研究

对教材的使用情况进行跟踪和研究是我们了解教材使用实践的重要渠道,它有利于我们在实际使用中发现教材所存在的问题,特别是一些隐性的、深层次的问题,为教材开发者改进编写提供反馈信息,为教材使用者提供参考和借鉴。教材使用研究是对教材使用主体在使用过程中的行为进行现象跟踪、规律梳理、问题探讨和策略分析的一系列过程。在研究中,使用行为是研究数据的基本“值域”,数据来源渠道的丰富性、数据处理方法的多样性对于研究结论的影响甚大。传统教材使用研究由于研究方法、思路和基本假设的桎梏,使研究数据在来源渠道、采集方式、处理方法等方面存在短板,随着教材研究的不断发展,这些使用数据已不能满足精细化、科学化研究的需要,亟需从方法论角度进行改进。作为教材研究中的重要一环,科学精细的教材使用和跟踪对于提升教材质量、改进教材编写具有重要意义。

一、教材使用研究的境况与不足

教材使用研究一直是学界的重要议题。笔者以“教材使用”及相关词在“中国知网”等学术搜索引擎进行主题搜索,得到从1953年至今约10663篇文献,涉及教材使用情况、教材使用意见、教材使用策略、教材使用效果和教材使用的问题五个方面,其中运用调查法进行使用情况研究占总量的82%,这些研究大都以教师、学生的教材使用行为作为研究的出发点,以问卷、访问或观察等方法为桥梁了解现实问题,研究结论大多以提供方法或对策为主。可以说,虽然目前有关教材使用的研究数量颇多,但在数据来源、处理分析方法等方面仍有一些不足之处,这不仅直接影响研究结论,同时亦不利于教材研究本身的发展和进步。这些不足之处表现为:

现有研究多以教师、学生两者的使用行为作为数据渠道,忽略了其他相关群体,如教材培训者、家长等,使用行为数据的来源较为单一。这可能是因为许多研究者在数据采集时受刻板印象的影响,将教材使用者尤其是教师作为体现教材特点的最主要来源,造成数据来源单一化,进而影响了研究的整体信度和数据范围。

数据来源单一还会影响所收集数据的类型。根据行为目标与动机的关系来划分教材使用主体的使用行为,大致可将其分为意志行为和潜意识行为两类,前者是指有明确动机及目标的行为,而后者则是有明确目标但无明确使用动机行为。[1]例如,学生翻看教材寻求解题答案属于意志行为,而发放新书后总是想看看内容属于潜意识行为。若将这些行为按照数据类型进行分类,那么意志行为既包括结构性数据又包括非结构性数据,而潜意识行为则主要表现为非结构性数据。[2]由于受到数据捕获渠道和方式的限制,现有的教材使用研究中的数据往往呈现为意志行为,数据类型上多为结构性数据,导致研究中数据类型单一,非结构性数据缺乏。

同时,现有研究中所使用的数据采集方式多为调查和观察,所搜集到的数据都是已经发生的行为或业已形成的观念态度,因此“结构性的已有意志行为”成为当前教材使用研究数据的主流,而教材使用者的许多不外显的潜意识行为却极少被关注,动态的、实时的、隐性的非结构化数据无法通过普通工具获得。这不仅造成研究数据来源薄弱,类型相似,也使得研究信效度受损。

如前所述,现有教材使用研究中问卷、访谈和观察成为数据捕获的主要方式,这些手段所获取的数据往往是某个时间点的现实呈现,具有“截面性”特征。更为重要的是,捕获数据的容量取决于研究者的意愿,受限于调研工具,数据受主观性的“污染”,研究者的个人观念对数据搜集有较大影响,难以完整反映教材使用中的真实行为和全面的情况,也难以全面反映被研究者的真实想法。

除了数据先天的“软肋”之外,现有研究中对数据的处理方式较为单调,也大大影响了研究的质量。一方面,传统的统计法、描述分析法仍然占据数据分析的主流,这样的方法往往只适用于结构化数据;而另一方面,由于收集方法的局限,使研究中非结构性数据缺失,许多新的数据处理方法难以应用,二者形成相互制约的环扣:数据本身的质量和类型使数据处理方法难以现代化,而数据处理方法的禁锢和滞后,又使得无法分析更多形式的数据,最终形成了恶性循环。

已有研究在数据来源的渠道、形式、采集方法和处理手段等方面均存在短板,最终导致研究的结果主观经验性倾向较强,研究结论趋同。因此整体结果覆盖面小,呈现方式单调。

二、大数据浪潮带来的突破

由于在数据来源、采集方法以及处理方式上的不足,现有教材使用的研究已不能满足教材研究精细化、科学化发展的总体趋势,这对于我国教材研究、教材编写和改进等工作的推进都十分不利。随着社会信息处理技术的不断发展和更新,大数据作为一股激烈的方法革命和思维革新浪潮,席卷了我们的生活。在教材使用研究中,大数据视角和方法为我们提供了更好的数据搜集和处理方法,也为我们看待教育现象提供了新的视野。

大数据视角强调数据规模、数据范围及种类的“大”,它在出现之初就致力于更好地为服务提供者反馈消费者的使用数据,以便能够更好地了解消费者的实际需求、提升商品质量、提供更为便捷的消费方式。对于教材研究者而言,使用大数据的思路审视教材使用研究,能够对以往研究中的数据来源渠道狭窄、类型单一、处理方式滞后等问题进行反思和改进,谋求新的思路。

在大数据时代,决定研究质量的主要是数据集的质量、数量和利用方式。[3]这就要求我们转变对以往研究数据的看法:首先,不再满足于利用少量的数据和样本进行代表性研究,而应尝试获得海量多样的数据;其次,重视目标行为中的非结构化数据,并尝试探索其隐含的意义,淡化对有条理、结构化数据的偏爱;第三,认同数据信息对研究结果的敏感影响,不再是规律性的陈述而是对各种教材使用行为之间相关性的表达。[4]

当前教材使用研究中面临着诸多数据问题,最大的突破口在于扩展数据来源及类型,丰富数据收集手段、改变数据处理方法,最终扩大研究结果适用范围,丰富其呈现方式,从而突破教材使用研究瓶颈。

数据来源渠道的扩展可以从对象范围和具体行为两方面入手。在对象范围上,突破教师、学生的局限,扩展到家长、教材培训者、教材采购方等其他教材使用的相关人员中;对各主体的具体行为来说,从以往的单一外显性意志行为扩展到潜意识行为的更大范围之中,如学生在课堂中接触到新内容时的抬头率、阅读新书本的时长等潜意识行为均可成为教材使用研究的数据。

数据来源的拓展也会带来数据类型的丰富。我们得到的数据不再是单本教材的、单一对象的外显行为,而是多本教材、多个对象、多种行为的综合反馈,综合反馈的行为中甚至还会有许多教材使用主体所未曾注意到的潜意识行为,而这种多样化的丰富反馈使研究数据的形式仅仅是原来单一的“二维表式”的结构化数据,而跨越到非结构化数据的范畴,大大丰富了教材使用研究的数据类型和形式。

针对现有研究中多以问卷调查、访谈等传统调研方法获取数据的不足,大数据为研究者提供了广阔而丰富的数据获取手段。如网络、网站分析工具、内部OA及用户管理等。[5]它们不仅可对已有“截面化”数据进行收集,还能对实时数据即时采收,例如网站分析工具可获得教师、学生关于教材使用的点击记录、上网记录等,用于分析研究电子教材的使用情况。同时,由于数据信息和研究对象的行为反应不是通过第三方手段而是直接获得,将可以有效避免干扰因素,如:问卷的编写质量及信效度对研究数据的影响,使研究数据“降噪”,有利于提高研究的信度。

同时,由于原有的数据统计方法和描述性分析对于海量数据的处理来说过于单薄,许多非结构化的数据所隐含的信息需要更为复杂、完善的处理方法。大数据为我们提供了离线批量处理和实时处理两种选择,使我们可以通过对教材使用行为的数据挖掘实现对教材使用过往发展的总结。例如:批量处理所有小学语文教师的网上搜索词组或近反义词行为,并将结果集中反馈,为了解不同层次语文教师对语义掌握程度提供证据。更进一步说,由于新的数据处理方法具有即时性的特征,使教材使用研究的时效性大幅提高,避免了以往研究中所获行为都是“已发生”数据的时效性困境,便于研究者在第一时间敏锐捕获教材使用者的使用习惯和潜在需求。

数据数量及形式的丰富、处理方法的转变为教材使用研究结论的转变提供契机,研究结论的覆盖面不断扩大,呈现方式更加多样。

首先,满足个性化需求的研究结论将不断增多,适用范围更广。由于使用了新的数据获取手段,挣脱了传统数据来源少、类型单一的束缚,采集的教材使用行为数据更加的细致多样。利用新的数据处理方法,可以根据不同对象的需求处理研究数据,得到的研究结论因对象需求不同而有所区别,就研究结论覆盖面而言,范围更广:不仅仅为教师制定更加精准有效的使用策略提供了决策支持,为学生个性化使用教材提供及时反馈和服务,更为教材的编写者、采购者改进教材编写、提升教材质量、制定采购方案提供有效信息和支持。

其次,研究结论的呈现方式更加多样,研究结论既可以是完整、静态的文本报告,也可以是一个开放的数据实时添加和生成的动态系统。例如,为了了解学生对某版电子教材的阅读策略,研究者可以长时间地跟踪学生的教材使用行为,搜集其在线阅读时长、答题情况等数据,并将这些数据实时更新、添加到数据库中,而数据系统则根据研究需要实时生成可视化的数据图表,以供分析使用。

研究的结果适用范围广,呈现方式更丰富,使研究的结果既可为宏观层面的教材政策决策提供支持,也可为中观层面的教材编写和改进提供有效反馈,还可为微观层面师生教材使用提供个性化建议。

三、大数据思路在教材使用研究中的局限性

大数据为经营者提供客户使用的反馈数据,为提升商品服务质量提供有效支持,成为企业提高核心竞争力的关键。在教育中,大数据思路也为教材使用研究的数据观带来新的想法。对于大数据而言,其对于教育研究的最大影响在于它可以提供传统方法无法收集或没有收集到的数据,进而提高研究精度。但不可讳言,大数据思路运用于教材使用研究中仍有一些局限。

首先,教材使用行为数据的有效性受到质疑。社会科学研究中的数据往往存在多源异构、交互性、突发性和“高噪声”等特点,教材使用行为就是典型的社会人文数据,因而教材使用研究中如何保证数据的有效性,区分干扰信息,降低数据“噪音”成为回应数据有效性质疑,规避大数据有效性密度低等问题成为保证研究质量的关键。

其次,大数据带来的研究伦理的争议会阻碍其在教材使用研究中的应用。由于数据收集渠道和方法的拓展,会使许多使用者的潜意识行为步入研究者的视野,对研究对象的隐私形成冲击,造成研究需要与研究对象隐私保护的矛盾。化解这一矛盾,有赖于对研究对象隐私的充分保护,而这是一项庞大而繁杂的工作。

第三,大数据的数据处理方法难度高,成为研究者望而却步的重要原因。研究者不仅要了解研究需求,还要建立合理、科学的数据分析模型,诸如此类问题仍然不少,因此现阶段大数据方应用可能仅仅是提供一种思路和视角,成为现有研究的有力补充,未来还需要大数据技术的长时间发展以及研究者的不断适应。

正是由于大数据思路的这些局限,研究者在应用时应保持客观审慎的态度。

[1]杜智勇等.组织行为学[M].郑州:河南科学技术出版社,2010:9-10.

[2]丁圣勇等.解惑大数据[M].北京:人民邮电出版社, 2013:5.

[3]丁世飞等.现代数据分析与信息模式识别[M].北京:科学出版社,2013:24.

[4]李春伟等.中国电子商务企业发展报告2013[M].北京:中国发展出版社,2013:263.

[5]艾瑞学院.蜕变——传统企业如何向电子商务转型[M].北京:清华大学出版社,2012:186.

[6]Jacqueleen A&Reyes..The skinny on big data in education:Learninganalyticssimplified[J].TechTrends,2015,59(2).

[7]Damian Bebell&Laura M&O’Dwyer,Michael Russell&Tom Hoffmann.Concerns,Considerations,and New Ideas for Data Collection and Research in Educational TechnologyStudies[J].Journalof Research on Technologyin Education,2011,43(1):50.

(编辑:鲁利瑞)

G624

A

:1673-8454(2017)04-0053-03

*本文受教育部2012人文社会科学项目“教材多样化的实践失范与政策改进研究”课题,2014年度全国教育规划课题“教材选用中的利益冲突及改进机制研究”项目资助。

猜你喜欢
研究者教材方法
教材精读
教材精读
高等教育中的学生成为研究者及其启示
教材精读
教材精读
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
用对方法才能瘦
医生注定是研究者
四大方法 教你不再“坐以待病”!