黄郁郁 王后雄
摘 要:基于Rasch模型开发初中生宏微结合能力水平测评工具,对武汉市九年级学生进行跨时间点施测,基于潜在转变模型探讨化学成绩等因素对初中生宏微结合能力水平潜在转变發展轨迹的影响,对教学和研究提供了数据支撑和方法借鉴。
关键词:初中生;宏微结合能力;潜在转变;学业质量
化学是研究物质的组成、结构、性质、转化及应用的一门基础学科,其特征是从分子层次认识物质,通过化学变化创造物质。Johnstone将微观和宏观通过符号这个桥梁进行了联系,为化学三重表征的研究开启了先河[1]。房宏较早提到了培养学生宏微结合能力[2]。宏微结合不是宏观和微观二者的简单叠加,而是在内涵和外延上有机统一的整体[3]。基于化学学科特征,从宏微结合角度解决问题,主要体现在三重表征的思维方式[4]。综合已有研究,将化学宏微结合能力界定为:运用宏观、微观、符号等多种思维加工与知识表征方式,从宏观和微观相结合的视角探究物质及其变化规律,从而解决问题的能力。
初中生化学宏微结合能力无法直接测量,属于潜在变量,只能通过统计程序分析测算。目前国内外学者对初中生化学宏微结合能力水平等级有数据收集[5],大多是通过建测评框架、开发测评工具,对宏微结合能力水平进行划分并研究其影响因素,缺乏对宏微结合能力水平纵向追踪研究的实证数据和研究模型。
潜在转变分析(Latent Transition Analysis,LTA)是在潜在类别分析(Latent Class Analysis,LCA)基础上进行纵向拓展的概率统计模型,已被应用于心理学和社会科学等领域的研究,如儿童情绪和认知的成长过程,青少年不良行为和心理问题随时间的发展,临床和心理疾病的追踪治疗等诸多方面[6][7]。相对于传统的根据分数线将学生进行“一刀切”的水平划分,潜在转变模型作为一种纵向追踪模型,可以为初中生化学宏微结合能力水平的变化趋势进行预测和干预提供了实证支撑。
1 初中生宏微结合能力水平测评工具开发
1.1 模型介绍
1.1.1 Rasch模型
Rasch模型是用来测评潜在特质的概率模型,其基本原理是特定的被试对特定的项目作出特定反应的概率可以用个体能力与项目难度的一个简单函数来表示。Rasch模型允许使用者生成一个既可以测评项目难度,又可以测评被试能力的等距量尺。基于Rasch模型,依据开发的测评工具对学生进行测试,并对分析结果进行反复修正,直至达到Rasch模型的参数要求,最终开发出一套信度和效度良好的初中生化学宏微结合能力水平测评工具(见图1)。
1.1.2 潜在转变模型
潜在类别分析(LCA)是用以探讨潜在变量的一种模型化的分析技术,属于一种聚类分析技术。被划分到同一类别的所有被试在所有项目上的正确作答率都被认为完全一样的,即将该类型被试视为同质的[8]。通过测评工具施测,用Mplus 7.4 对收集的数据进行处理,可以将学生在宏微结合能力水平上的个别差异以质性的类别差异显现出来。潜在转变分析(LTA)是在潜在类别分析(LCA)基础上建立起来的高级统计学技术,它不仅可以区分不同的发展趋势类别,还可以估计出每个类别中的个体数及所占总体概率的大小和每个类别的平均发展轨迹等。
初中生化学宏微结合能力水平潜在转变研究技术路线见图2所示。分别以T1时间点、T2时间点两次测试成绩作为外显反应指标变量,建立潜在类别模型,确定最佳潜在类别数。在T1时间点至T2时间点的时间段,根据潜在转变率分析不同潜在转变组的转化情况,以性别和化学成绩为自变量,宏微结合能力水平转变类型为因变量,采用多元Logistic回归进行潜在转变概率的影响因素分析和预测。
1.2 测评对象选择
为了对初中生宏微结合能力水平测评工具进行检验和修正,在武汉市选取部分九年级学生进行两轮施测,第一轮测试共发放试卷535份,回收试卷533份,回收率为99.63%,其中男生270人,女生263人。第二轮测试共发放试卷527份,回收试卷522份,回收率为99.05%,其中男生259人,女生263人。
获取学生近期三次化学测试成绩,求出平均值并从高到低排序,前27%划分为化学成绩优异,中间46%划分为化学成绩中等,后27%划分为化学成绩较低[11],分别赋值3、2、1,考察化学成绩对学生宏微结合能力水平潜在转变的影响。
1.3 测评工具设计
依据和《义务教育化学课程标准(2022年版)》[9]中对化学宏微结合知识学业质量的描述,结合学习进程理论,由低到高把初中化学宏微结合知识划分了四个水平等级。参考课程标准以及武汉市近几年中考试卷,共设计了20道试题,邀请大学教授、特级教师、教研员和骨干教师对试题及水平等级进行了审核。各试题考查内容均为初中生化学宏微结合能力相关内容。水平1的试题包含了Q1、Q2、Q3和Q9;水平2的试题包含了Q4、Q5、Q6、Q11、Q15和Q17;水平3的试题包含了Q7、Q8、Q10、Q12、Q13和Q14;水平4的试题包含了Q16、Q18、Q19和Q20。以第20题为例,测评工具题型及能力水平分布如表1所示,试题解读如下。
【Q20】某同学对某地工业废水(含有硫酸和盐酸)中的H2SO4进行测定。取50g该废水于烧杯中,小心加入BaCl2溶液,充分反應,实验过程中,生成沉淀的质量与滴入BaCl2溶液的质量关系如右图所示,通过计算求50g该废水中H2SO4的质量分数。
此题以工业废水的检测为情境,要求学生从宏观上掌握酸和盐的反应,从微观上认识硫酸根离子和钡离子的结合,以宏微结合的视角看待化学反应。根据图像的变化趋势基于证据进行推理,对宏微结合能力水平要求较高,划分为水平4。
1.4 测评工具检验
按照赋分标准对回收的试卷进行评阅,在Excel 2010 中输入数据进行预处理,再用Winsteps 3.66对初测数据进行信度分析、拟合度与误差分析、项目-被试对应以及单维性检验,以考究测评工具质量,利用SPSS 25.0 进行描述性与差异性检验。修正后测评工具的项目(item)与学生(person)整体统计结果见表2所示。
本测评工具的项目信度均大于等于0.80,属于理想信度。原始的项目分离度为11.56,修正后的分离度为12.45,说明本测评能较好地区分不同能力水平的被试。在单维性检验中,测评的20个项目的首成分残差特征值是1.70,符合单维性要求的1.40-2.10之间的测量学标准[10]。项目难度值在-1.04至1.66之间,难度均值为0.00,难度标准差在0.04至0.10之间,各试题难度适中。项目内部拟合度在0.81至1.22之间,基本符合测评对试题拟合度的要求。项目-被试对应显示,各项目的难度和分布均匀分散,被试的水平分布基本符合正态分布规律。总体而言,修正后的测评工具在统计指标的许可范围内,基本可以反映学生的能力分布。
2 初中生宏微结合能力水平潜在转变分析
2.1 测评对象选择
采用整群抽样的方法,分别在2021年3月19日(以下简称T1时间点)和2021年6月2日(以下简称T2时间点)对武汉市部分九年级学生进行测试。追踪研究必须保障是同一批被试和同一测验(或平行测验),然而平行测验在学科测验中几乎无法做到,由此带来的误差可能比重复测量引发的练习效应更严重。因此在这两次测试中,打乱试题及选项顺序,尽可能降低练习效应。同时参加两次测试的学生541名,其中,男生268人,女生273人;两次测试的克隆巴赫Alpha值分别为0.77和0.81,信度均较好。
2.2 描述性与差异性检验
采用Mplus 7.4对T1时间点、T2时间点两次测验数据进行潜在类别分析(LCA)和潜在转变分析(LTA)。采用SPSS 25.0对测验数据进行描述性与相关性分析、差异检验、多元logistic回归分析等。表3显示,学生宏微结合能力成绩随时间推移逐渐上升,且在两个时间点上得分差异显著。
2.3 潜在类别数目确定
表4呈现了T1时间点和T2时间点不同类别数量潜在类别的模型拟合指标和熵值,AIC、BIC和aBIC值随着类别数目的增多不断减小,当模型达到2类别时,BIC 和AIC 值最小,表明2类别模型与数据拟合最佳,熵值较大(Entropy>0.8),且LMRp和BLRTp似然比检验均具有统计学意义[12]。综合考虑模型简洁性与准确性,选取2类别潜在转变模型。
两个时间点的初中生化学宏微结合能力水平潜在类别的条件概率图如图3和图4所示。在T1时间点,第一类别学生(34.75%)在各试题上的得分均低于第二类别学生(65.25%)在各试题的得分。T2时间点,第一类别学生(21.81%)在各试题的得分均低于第二类别学生(78.19%)在各试题的得分。根据各试题的条件概率,将第一类别命名为“低水平”,将第二类别命名为“高水平”。
用Mplus 7.4 以不添加任何协变量的潜在模型来分析不同水平组的学生的变化情况,2×2转变矩阵的对角线表示学生在两个相邻时间点保持原潜在状态的概率,如表5所示。高水平的学生保持原组的概率为57.30%,低水平的学生保持原组的概率为19.60%。低水平的学生往高水平的转变的概率为80.40%,高水平的学生往低水平转变的概率为42.70%。
引入潜在转变数据分析方法拟合初中生化学宏微结合能力水平发展轨迹的潜在类别,根据2×2的潜在转变模式最终确定了四种类别的宏微结合能力水平发展轨迹,分别命名为低水平稳定组(53人)、低转高水平组(220人)、高转低水平组(111人)和高水平稳定组(157人)。
3 初中生化学宏微结合能力水平潜在转变及影响因素分析
3.1 初中生宏微结合能力水平潜在转变的跨时间效应
T1时间点,四种潜在转变模式下学生宏微结合能力水平潜在转变部分回归图见图5所示,学生的化学宏微结合能力水平分布在左右两端,主要集中在-0.8和1附近,处于较低水平和处于较高水平的学生人群相对集中。武汉市初中生从九年级上学期开始学习化学知识,次年三月左右结束新知识学习。T1时间点时,学生刚学完初中化学知识,一部分学生在化学宏微结合能力水平占据一定优势,处于比较高的水平,另一部分同学处于相对较弱的水平,两极分化现象较明显。
T2时间点,四种潜在转变模式下学生宏微结合能力水平部分回归图见图6所示,学生的化学宏微结合能力水平在0左右两边呈正态分布。在这三个月的复习过程中,通过专题复习,学生对宏微结合相关知识掌握得更加牢固,能更清晰地认识物质的宏观组成与微观结构,化学变化有新物质生成,其本质是原子的重新组合,并遵循一定规律。在知识复习和习题训练的过程中,学生逐步形成了从宏观、微观、符号相结合的视角探究物质及其变化规律的认知方式,宏微结合能力水平趋于同质化,两极分化现象明显减弱。
3.2 不同潜在转变模式下性别差异分析
四种潜在转变模式的学生人数在性别上的分布见表6所示,数据显示,性别×潜在转变模式的卡方检验结果显著(χ2=37.14,p<0.01)。男生更容易稳定在高水平或由低水平转向高水平,女生更容易稳定在低水平或由高水平转向低水平。
有研究表明,学生智力水平高低与性别无显著相关,但学业成绩与性别有显著相关。男生在理科科目的学习上更占优势,女生在文科科目的学习上更占优势[13]。学者们从生理结构、成就目标、归因模式、社会期待等方面合理解释了产生这种现象的原因。化学宏微结合知识的学习对空间知觉和空间视觉化能力要求较高,男生更擅长对微观粒子进行抽象理解,用符号进行表征,以宏微结合的视角认识化学变化。
3.3 不同潜在转变模式下化学成绩差异分析
四种潜在转变模式的学生人数在化学成绩的分布见表7所示,数据显示,化学成绩×潜在转变模式的卡方检验结果显著(χ2=219.09,p<0.01)。化学成绩较低的学生更容易稳定在低水平或从高水平降到低水平。化学成绩优异或中等的学生更容易稳定在高水平或从低水平升到高水平,且在低转高水平组所占人数比例最大的是化学成绩中等的学生(70.45%)。
“化学观念”反映了化学学科核心素养的学科特质,以宏微结合的视角认识物质及其变化,形成化学观念,为学生掌握化学知识体系,结合化学学科特征解决实际问题提供了可能。“科学思维”“科学探究与实践”“科学态度与责任”体现了作为科学课程重要组成部分的化学学科核心素养的领域特质,基于证据推理、建构模型等对学生化学宏微结合能力水平提出了更高的要求。从不同素养维度均衡发展,提升化学成绩,能有效促进学生化学宏微结合能力水平的发展。
4 结论与启示
通过对初中生不同水平、不同性别、不同学业成绩在化学宏微结合能力水平潜在转变的实证研究,为化学教学中发展初中生化学宏微结合能力水平提供了有益启示。
4.1 依据学生水平差异,实现精准干预促进水平进阶
基于实證数据,识别出属于低水平稳定组的学生,针对其稳定性较弱的特点进行合适的引导和干预,促使其向高水平转变。识别出高转低水平组的学生,对他们给予充分的重视与关心,诊断干预,精准施策,抑制其向低水平转变。识别出属于低转高水平组和高水平稳定组的学生,合理施策,促使他们从低水平转变为高水平或稳定在高水平。根据不同潜在转变组学生的特点,通过构建教学主线、精选情境素材、问题引领活动、设计创新实验和重视内容结构化[15]等措施精准干预帮扶,促进学生化学宏微结合能力水平的发展。
4.2 利用学生性别差异,开展小组合作实现优势互补
数据表明,男生在学习宏微结合相关知识上具有显著优势。男生和女生在认识、分析和解决问题的视角与方式上不尽相同,化学宏微结合能力水平也有所差别。在思维方式、文化背景、社会期待等因素的影响下,男生更容易稳定在高水平组或从低水平转变为高水平。可以利用性别差异,男女搭配划分小组。在分工与合作完成学习任务的过程中,加强男生和女生的沟通与交流,进行良性竞争与合作,共享学习成果。
4.3 正视学生学业差异,实现分层教学提升学业质量
数据表明,化学成绩对学生宏微结合能力水平的发展存在显著性差异,化学成绩优异的学生发展宏微结合能力水平更具优势。在低转高水平组人数比例最高的是化学成绩中等的学生。教师在开展素养导向教学时要“抓两头,带中间”,以大概念为统领,科学制订教学目标,分层组织教学活动。通过化学实验引导学生探究,基于证据进行推理。借力信息技术实现微观粒子可视化,以宏微结合的视角认识化学变化,形成化学观念,解决实际问题。通过动画模拟帮助学生建立模型,搭建宏微桥梁,解释宏观现象,揭示微观本质。开展跨学科实践活动,多维度、多途径助推学生化学学业质量的提升以及化学宏微结合能力水平的发展。
参考文献[1] Johnstone A H. Macro and micro chemistry[J].School Science Review,1982,64(227):377-379.
[7] Castellini G,Fioravanti G,Lo Sauro C,et al.Latent profile and latent transition analyses of eating disorder phenotypes in a clinical sample:A 6-year follow-up study.Psychiatry Research,2013,207:92-99.