工科学生物理实验能力量化研究初探

2017-03-23 06:09田霖鹏吕思颍朱亚彬彭继迎张进宏
物理与工程 2017年1期
关键词:示波器问卷题目

田霖鹏 吕思颍 朱亚彬 彭继迎 范 玲 韩 笑 张进宏 张 斌

(北京交通大学理学院,北京 100044)

工科学生物理实验能力量化研究初探

田霖鹏 吕思颍 朱亚彬 彭继迎 范 玲 韩 笑 张进宏 张 斌

(北京交通大学理学院,北京 100044)

物理实验是工科院校的必修基础课程,物理实验能力的量化测评一直是个难点。本文根据加拿大不列颠哥伦比亚大学物理实验能力测试相关工作和本校物理实验教学的实际情况,挑选7道题目,又自行编写3道题目,构成一份物理实验能力的测试卷。对本校400多名本科生进行了前测和后测,有效问卷300多份。运用统计学方法,对单个题目和整体试卷进行统计量化计算(如难度系数、差异系数和点双列系数,整套题的Ferguson’s delta)。结果表明,此测试卷的平均难度系数、平均差异系数和平均点双列系数都在合理范围内;整套题目的Ferguson’s delta为0.85,接近期待值0.9。虽然问卷的克伦巴赫信度低,但是通过对测试问卷进行显著性检验,结果显示此问卷可行。

物理实验能力; 量化研究; 测试问卷; 统计学方法

0 导言

大学物理实验是工科大学生进入大学后接触的第一门实践课,物理实验能力的强弱,直接影响后续专业实验课程的学习,以及未来科学研究和工作能力。物理实验的主要活动是测量,即借助一定的仪器,运用各种实验方法,对物理量进行测量;记录实验数据,并采用图解法,最小二乘法等方法处理数据;对实验结果进行不确定度分析[1]。 而物理实验能力的测量,需要借助量表(测试卷),对学生进行测量,运用统计学方法对数据进行分析,即量化研究。2011年加拿大不列颠哥伦比亚大学的James Day 和 Doug Bonn[2],在美国物理评论专题:物理教育研究杂志上发表了简明数据处理测评(concise data processing assessment, CDPA)的文章,据我们所知,这是第一个关于物理实验能力的测评工具。2012年美国科罗拉多大学的Benjamin M. Zwickl, Noah Finkelstein 和H.J.Lewandowski[3], 在费城的物理教育研究会议上介绍了科罗拉多物理实验学习态度科学调查(the Colorado Learning Attitudes about Science Survey for Experimental Physics, E-CLASS)工作。2014年加拿大不列颠哥伦比亚大学的Jared B.Stang和Ido Roll[4],在美国物理评论专题:物理教育研究杂志上发表了物理实验室中助教与学生互动对实验能力影响的文章。与物理理论课的量化研究的力学概念汇总(Force Concept Inventory, FCI),力学基本测试(Mechanics Baseline Test, MBT)和电磁学测试(The Brief Electricity and Magnetism Assessment, BEMA)等量化测试相比[5],物理实验能力科学评估的研究工作才刚刚起步,成为具有国际性水平的教育评估体系仍需要进一步的探索与实践。

我们从2014年9月份开始开展物理实验能力测评的工作,围绕超声波原理及应用专题实验设计了4套题目,在2013级学生中实施测试,将统计结果发表在2015年8月份北京举办的国际物理教育大会论文集中。本文介绍的工作旨在评估工科学生的物理实验综合能力,因此,从文献中挑选7道题目,增加自己编写3道题目,构成测试卷,在2014级学生中实施测试,详细情况见背景介绍部分。

1 实验背景

1.1 问卷的设计

我们总结的物理实验能力测试主要包括:阅读实验讲义(说明书)的能力,动手操作的能力,观察物理现象的能力,正确记录数据,进行不确定度计算,分析实验结果能力等等[6,7]。经过仔细阅读分析文献中的工作,发现有些题目涉及的内容,我们的实验课程没有对应的内容,比如James Day 和 Doug Bonn设计的光通量题目。所以,根据我们的实际情况逐题筛选,具体题目见附录。

附录中题目1是考查阅读实验说明书的能力,题目3和题目5是考查实验方法和测量结果知识,这3道题目是我们自行编写的题目;题目6,7和8,是测试不确定度和有效数字的知识,题目9是有关图形结果分析的,这4道题目选自James Day 和 Doug Bonn的工作,见文献[2];附录题目2和4 的考点是数据记录及分析,题目10根据图形进行实验规律推论的题目,选自Jared B. Stang和Ido Roll的工作,见文献[4]。

1.2 测试实施

北京交通大学2014级近400多名同学作为研究对象,在2015年3月,学生第一次上实验理论课发放问卷,进行前测,有效试卷394份。在2015年6月和9月,学生经过一学期的实验课程学习和训练,进行后测,有效试卷316份。每位测试对象在10~30min内通过笔试答题的方法填写测试问卷。测评目标是考查通过物理实验课程的学习,实验能力提高的程度,所以,参数的计算均依据后测数据。

2 测试问卷的统计评估

我们对物理实验能力测试问卷进行4项统计学检验:测试问卷难度系数、测试问卷差异系数以及测试问卷的点双列系数,弗格森增量(Ferguson’s delta)。在以下各节中,本文对每个检测项目进行了简要说明以及结果分析。

2.1 测试问卷难度系数

测试问卷难度系数P用来衡量测试问题的难易程度,即某个问题的正确答案所占的比例。N1代表回答正确的学生总数,N代表回答问题的学生总数,则

(1)

P值越大,学生们给出正确答案的比例越高,说明这道题对于学生们来说越简单。难度系数P值的范围是[0,1],如果P值取到零,代表没有一个人回答正确;如果P值取到1,代表所有人都答对了这个问题。对于这两种极端的现象,设计问卷时应竭力避免。

(2)

本文涉及的物理实验能力测试问卷各个题目的难度系数表如图1所示,从图中可看出,本问卷的平均难度系数为0.63,在合理的可接受的范围内。

图1 题目难度系数

2.2 测试问卷差异(区分)系数

测试问卷的差异系数D代表测试中每个题目的区分度。具有较高区分度的问题可以测试出同学们对知识或能力的掌握程度,知识掌握全面的同学一般回答正确,知识掌握不全面的同学一般回答错误;区分度低的问题可能会使掌握全面知识的同学给出错误答案,而知识掌握不全的同学给出正确答案。所以,一份问卷如果每个问题的区分度都很高,就可以在所测试的领域,明确判断出学生对知识掌握程度。

在教育与心理学中,差异系数计算分段有25%和50%两种。本文采用25%的计算分段。计算测试问卷差异系数,我们将学生样本分为两个组,个人总分比整个样本的第一4分位数(对样本进行降序排序后,对样本进行4等分,处于分割点位置的数值记为4分位数)高的分为一个高分组H,个人总分比整个样本第三4分位数处分数低的分为低分组L,将在组H与L中做出正确答案的数量命名为:NH与NL,记学生样本总数为N。差异系数D计算公式为

(3)

差异系数D的取值范围为[-1,+1],其中+1为最好的差异系数,-1为最差的差异系数。例如在极端情况下,同学们答出正确答案的都在H组,答出错误答案的都在L组,则会得出最好的差异系数+1;若同学们答出正确答案都在L组,答出错误答案的都在H组,则会得出最差的差异系数-1。但是,我们要极力避免这些极端情况出现。一般地,当差异系数D≥0.3时,认为该问卷具有较高的区分度;但是若差异系数0≤D≤0.3,并不一定代表问卷有问题。通常情况下,高信度的问卷具有较高的差异系数。物理实验能力测试问卷的差异系数如图2所示。

图2 题目的差异系数

(4)

2.3 测试问卷点双列系数

点双列系数是单个测试题目与整套测试题目一致性的度量,也是每个题目的可靠性指标。点双列系数反映学生答出单个题目的分数与总体分数之间的相关性。如果点双列系数为正值,则单个题目与总体题目具有较高的正相关,代表获得更高总分的学生会具备较大的可能性去答对单个题目;若点双列系数为负值,则代表获得较低总分的同学会具备较大可能性去答对单个题目,这说明此次测试卷存在缺陷。

计算点双列系数,需要计算单个题目分数与总分数之间的相关系数,学生在单个题目上的得分只有两个选择,1分代表正确,0分代表错误,是二元变量;总体得分是连续性变量。单个题目得分与总体得分之间的联系——点双列系数rpbs为

(5)

点双列系数取值范围是[-1,+1],点双列系数为1,说明所有的题目与总得分高度正相关,但是在实际操作中不容易实现,一般可接受的点双列系数范围是rpbs≥0.2。我们测试问卷的点双列系数计算,如图3所示。

图3 点双列系数

从图3可以看出,大部分题目的点双列系数落在0.2与0.5之间,第一题的点双列系数小于0.2,说明这个题目与整个测试卷相关性小,需要进行调整。

对所有单个题目的点双列系数取平均值

(6)

此处K代表测试问卷的题目总数。

2.4 测试问卷弗格森增量

弗格森增量是度量测试卷整体特性的一个统计参数,弗格森增量通过所有同学们的总成绩分布的范围来表征整个测试问卷的区分度,如果测试对象覆盖面广 (对测试内容理解不同层次的学生都存在),测试卷的分数分布范围就广,各个分数段的学生都存在。

任意两个同学的总分只有两种情况:相同或不同。令fi表示每一个总分出现的频数,i标识测试问卷中出现的分值(数)(如,5分和9分用不同i进行区分),则两个相同总分(分数对)的总数为

(7)

且不同总分(分数对)的总数为

(8)

令K表示测试问卷的题目数量,N为接受测试的同学们的数量,如果

(9)

则不同总分的总数将达到最大。使用此频数代替上式中的fi,则会得出一份测试问卷中的不等分数对的最大数量,为

(10)

而不等分数对的数量与一个测试所产生的最大数量的比值被称为弗格森增量δ

(11)

2.5 测试问卷信度

问卷的信度常用的是克伦巴赫系数α,其计算公式为

(12)

本物理实验能力测试问卷时,α为0.011,小于克伦巴赫系数的接受值0.5,说明本问卷内部一致性较弱,原因是本物理实验能力问卷的题目选自不同文献。所以对于本文单选题的客观问卷,我们可以引进对信度的另一种检验方法——显著性检验。

我们需要构造检验统计量并做两个随机变量(测量值与真实值)的双侧假设的显著性检验:

(1) 建立假设:

H0:μX=μTvs H1:μX≠μT

其中,μX是测量值X的期望;μT是真实值T的期望。

(2) 确定拒绝域: 一般来说,大样本数据的分布都是近似服从正态分布的。

就是大半锅剩下的鸡血鸡杂汤,一点葱花,一碗米饭,正煮着。我于是坐下来,跟老板一起等鸡汤熟。老板还拉着腔调教我:“不要急。鸡汤泡饭,就是要慢慢笃一笃(此为吴语),才有味道的。”我说:“是,不急。”两人搓着手,在江南没有暖气的寒浸浸的冬天里,就着炉灶等那一锅鸡汤将米饭泡润起来——现在想来,盯着米饭被鸡汤泡润起来那片香味,就像灵魂被唤醒了似的。

(13)

(14)

3 实验结论

我们用统计方法计算了物理实验能力测试问卷的难度系数、差异系数、点双列系数以及弗格森增量,其结果如表1所示。从表1中可以看出,本文提及的物理实验能力测试问卷的各项值都在有效范围内。通过对物理实验能力测试问卷的显著性检验,认为物理实验能力测试问卷结果的真实值期望与观测值期望相同,得出本测试问卷是可行的结论。

表1 统计后的实验结果

[1] 成正维,牛原,张斌,等.大学物理实验[M]. 北京:北京交通大学出版社,2010. Cheng Zhengwei, Niu Yuan, Zhang bin, et al. Experiment of college physics[M]. Beijing Jiaotong University Press, 2010. (in Chinese)

[2] Day J, Bonn D, Development of the concise data processing assessment[J]. Phys.Rev.ST Phys.Educ.Res. 2011, 7(2): 010114-1-14.

[3] Zwickl B M, Finkelstein N, Lewandowski H J, Development and validation of the colorado learning attitudes about science survey for experimental physics[C]//presented at the Physics Education Research Conference 2012, Philadelphia, PA, 2012.

[4] Stang J, Roll I, Interactions between teaching assistant and students boost engagement in physics labs in physics labs[J]. Phys.Rev.ST Phys.Educ.Res. 2014, 10(2): 020117-1-15.

[5] 方恺,杨丽佳, 蔡天芳,等.物理教育研究评估[J].大学物理,2009,29(5):44-47. Fang Kai, Yang Lijia, Cai Tianfang, et al. Physical education research assessment[J]. College physics, 2009, 29(5): 44-47. (in Chinese)

[6] 张亚武.物理实验能力培养的探讨[J].阜阳师范学院学报(自然科学版),2002.19(4):69-70. Zhang Yawu. Exploration of cultivating experimental abilities[J]. Journal of Fuyang Teachers College (Natural Science), 2002, 19(4): 69-70. (in Chinese)

[7] 刘晓红,杨建设,朱昌平,等.培养本科生物理实验“四种能力”教学模式的研究与实践[J].实验技术与管理,2008, 25(12):154-156. Liu Xiaohong, Yang Jianshe, Zhu Changping, et al. Research and practice of teaching mode for cultivating undergraduates’ “Four Kind of Abilities” in physical experiments[J]. Experimenal Technology and Management, 2008, 25(12):154-156. (in Chinese)

[8] Aubrecht II G J, Aubrecht J D, Constructing objective tests[J]. Am.J.Phys. 1983, 51(7): 613-620.

[9] 朱松涛. 对试卷信度计算公式的改进[J]. 曲阜师范大学学报,1998,24(3):87-88. Zhu Songtao. Improvement of reliability calculation formula of examination paper[J]. Journal of Qufu Normal University, 1998, 24(3): 87-88. (in Chinese)

[10] 茆诗松,程依明,濮晓龙,等.概率论与数理统计[M].北京:高等教育出版社,2011. Mao Shisong, Cheng Yiming, Pu Xiaolong, et al. Probability and mathematical statistics[M]. Beijing: Higher Education Press, 2011. (in Chinese).

附录 物理实验整体测试题

学院________ 班级________

生源地______(省) 学号________

姓名________ 城市应届/农村应届____(应)

1. “触发是示波器采集和显示波形的定位点,在模拟示波器中只能显示触发点(满足触发条件)以后的波形,数字示波器开始波形数据采集后一旦触发条件满足的触发点出现时,继续采集足够的数据, 因此在数字示波器中采集的数据包括触发点前后的数据,触发前的数据显示在触发点的左方,触发后的数据显示在触发点的右方,因此它可以观察触发前的信号,例如研究器件损坏前的信号或继电器触点的波形都十分方便” 从这段话中,可看出模拟示波器和数字示波器的异同,以下表述正确的是[ ] A. 两种示波器都有触发功能,数字示波器可显示触发前后的数据,功能优于模拟示波器; B. 两种示波器的触发功能一样; C. 触发前的数据显示在触发点的右方,触发后的数据显示在触发点的左方; D. 模拟示波器的触发功能优于数字示波器。

2. (选自文献4)小李和小张测书本的长度,小李的数据:25.63cm,25.50cm,25.60cm;小张的数据:13.60cm,25.50cm,35.61cm。哪个数据最接近书本的真实长度?[ ] A. 25.50cm,两人唯一重复的数据; B. 25.58cm, 小李数据的平均值; C. 25.24cm,所有数据的平均值; D. 24.90cm, 小张数据的平均值。

3. 在实验中如何实现瞬时速度测量,以下说法正确的是[ ] A. 测量一段的距离和所用时间,计算的平均速度就是瞬时速度; B. 测量距离时间,用公式s=s0+vt计算; C. 测量很短距离和所用时间,计算的短时间内的平均速度就是瞬时速度; D. 不清楚。

4. (选自文献4)实验室统计30年间(1980—2010年)学生成绩,选择下面哪组数据进行分析?[ ] A. 1980和2010年; B. 2001,2002,2003,2004,2010年; C. 1980,1985,1990,1995,2010; D. 1985,1990,1995,2000,2005。

5. 两个同学测量激光波长,波长为625.0nm,他们讨论测量多少次,可以停止测量。下面说法正确的是[ ] A. 他们两位得到同一个值两次; B. 他们注意到结果收敛在一个单一的区间内; C. 重复测量两次; D. 他们得到625.0nm时。

6. (选自文献2)两位同学测量水龙头的流速,他们的结果分别是(90±12)mL/s和(110±1)mL/s。如果计算多长时间可以加满1L容器,你的结果是[ ] A. 10.0s; B. 9.1s; C. 11.1s; D. 9.5s。

7. (选自文献2)一个大圆柱体的质量是小圆柱体质量的(3.1±0.1)倍,如果小圆柱体的质量是1.98892g,那么大圆柱体质量的表达式为[ ] A. (6.165652±0.198892)g; B. (6.16565±0.19889)g; C. (6.2±0.2)g; D. (6.16±0.199)g。

8. (选自文献2) 用一个小量程的电子秤称量几块小的矿石,得到数据为m=(20.0±4.0)g;用另外一个大量程的电子秤称量一堆矿石的质量为m=(6000±20)g,一堆矿石中含多少块矿石,最佳答案是[ ] A. 300±1; B. 300±5; C. 300±60; D. 300±80。

9. (选自文献2)下面的图是20℃时,一个气瓶安全时压强和体积的关系图。哪个数学公式是p~V关系的最佳表达?

A.p(V)=A·eB·VA=4Pa/m3,B=-4; B.p(V)=A·eB·VA=4Pa,B=-4m-3; C.p(V)=A·VBA=4Pa·m3,B=-1; D.p(V)=A·VBA=4Pa,B=-1m-3。

10. (选自文献4)观察下面两幅图,关于1961—2010年的温度,跟1881—1930年时间段的温度比较,以下说法正确的是[ ] A. 以相同速率增加; B. 温度增速变缓; C. 温度增速更快; D. 温度没变化。

QUANTITATIVE RESEARCH OF THE ABILITIES FOR PHYSICS EXPERIMENT ON EDUCATION EVALUATION

Tian Linpeng Lv Siying Zhu Yabin Peng Jiying Fan Ling Han Xiao Zhang Jinhong Zhang Bin

(School of Science, Beijing Jiaotong University, Beijing 100044)

Physics experiment is one of the basic compulsory courses in engineering university. Quantitative evaluation of the physics experiment abilities has always been a difficulty topic. Based on relevant works of the University of British Columbia (Canada) and the actual situation of physics experiment teaching in our university, seven questions were selected from the test used in the University of British Columbia, and three self-designed questions were added to form a questionnaire for physics experiment evaluation. Pre-test and post-test were conducted among a total of 400 undergraduates in our university and 300 were valid. Statistical quantitative calculation was employed in each question and the questionnaire as a whole (Including the difficulty index, the discrimination index, the point biserial coefficient and the Ferguson’s delta of the questionnaire). The results showed that the average of the difficulty index, the discrimination index, the point biserial coefficient of this questionnaire were in reasonable range, and the Ferguson’s delta of the questionnaire was 0.85, which was close to the expected value of 0.9. As shown in the results, although the Cronbach reliability was low, this questionnaire was still feasible after significance test.

physics experimental ability; quantitative research; questionnaire; statistical method

2016-04-27;

2016-10-27

北京交通大学校级大学生创新创业训练计划项目(150170045)。

田霖鹏,男,本科生,信息与计算科学专业,主要从事数学统计方面研究,13271060@bjtu.edu.cn。

朱亚彬,女,副教授,主要从事物理实验教学,以及光电功能薄膜材料的制备和物性研究,ybzhu@bjtu.edu.cn。

田霖鹏,吕思颍,朱亚彬,等. 工科学生物理实验能力量化研究初探[J]. 物理与工程,2017,27(1):37-43.

猜你喜欢
示波器问卷题目
唐朝“高考”的诗歌题目
关于题目的要求
本期练习类题目参考答案及提示
一款教学示波器的Y通道设计与实现
可携带式虚拟双踪示波器
问卷网
基于TEGRA K1的实时信号处理示波器的设计
追根求源
问卷大调查
问卷你做主