尹学慧 张雨强
初中学业水平考试(以下简称“初中学考”)是义务教育阶段的终结性考试。它既是衡量学生是否达到毕业标准的主要依据,也是高中阶段学校招生的重要依据[1]。2010年教育部印发的《教育规划纲要》标志着中考政策进入创新与全面深化改革时期[2]。2014年、2016年和2019年,国务院、教育部分别颁布了 《关于深化考试招生制度改革的实施意见》《关于进一步推进高中阶段学校考试招生制度改革的指导意见》《关于深化教育教学改革全面提高义务教育质量的意见》《关于加强初中学业水平考试命题工作的意见》等重要文件,文件对初中学考相关工作从功能定位、组织形式、评价范围、评价理念、考试成绩呈现方式、考试命题等方面进行了指导安排。这一系列政策文件既突出了国家层面对义务教育质量的关注,也体现了初中学考对教育教学和素质教育的导向引领作用。本研究以CiteSpace为研究工具,运用文献计量法和内容分析法,对中国知网2010-2019年间所收录的初中学考的期刊文献进行呈现、梳理和分析,进而探测近10年初中学考的研究状况和特点,为更好地开展初中学考研究提供参考。
以中国期刊数据库(www.cnki.net)为检索平台,在高级检索中分别输入 “学业水平考试”全文并含“初中”或“中考”全文并含“学业水平考试”或“考试评价”,发表时间设置为2010年1月1日至2019年12月3日。共检索到相关论文1460篇,剔除重复、征稿启事、会议通知等关联性不强的载文643篇,最后确定717篇研究性论文作为统计对象。
为直观呈现初中学考研究的样态,借助陈超美教授开发的CiteSpace软件进行数据分析。将选定文献记录导入Cite Space5.5.R2软件,设定时间区间(Slice)为 1 年,数据来源为标题(Title)、摘要(Abstract)、作者给出的关键词(Author Keywords)等,节点类型分别选择作者、机构、关键词,运行软件进行可视化分析,借助该软件统计年度发文量和期刊分布。运用文献分析法梳理研究主题,总结初中学考研究的特点。
对近10年初中学考研究的发文量进行统计,有利于整体把握本研究的发展趋势。如图1年度发文量分布所示,整体呈增长趋势。具体可以分为两个阶段:(1)平稳增长期(2010-2014 年),这一时期每年发文量在29-68篇之间,五年累计202篇,占样本总数的 28.17%;(2)快速增长期(2015-2019 年),这一时期发文量从57篇增长到150篇,总发文量515篇,占样本总数的71.83%。近期教育部颁布的重要文件为学界研究提供了明确的政策指引,初中学考研究热度将会持续保持。
图1 年度发文量分布
研究期刊分布主要是为了解发文的期刊类别及其发文情况。对717篇学术论文的发表期刊名称进行统计,期刊类别达296种,将载文量在5篇及以上的期刊制作成表1。其中,“学科类”教育期刊发文量最高,占比46.98%;“综合类”和“考试类”期刊发文量相近。在20种期刊中,核心期刊达14种,占比70%。因此,关于初中学考的研究,核心力量层次较高,为后续深入的专业化研究提供了有效支撑。
对某一研究领域的研究机构和论文作者进行统计分析可以探测该研究领域的主要研究机构、研究基地、主要作者和研究团队。
通过研究机构知识图谱(见图 2)和相关数据的分析发现,初中学考研究机构主要有两大类。第一类是高等院校,第二类是教研室和中学。主要研究机构有北京师范大学教育学部、华东师范大学课程与教学研究所、北京教育考试院、英语周报社和西南大学科学教育研究中心等。这些机构构成了初中学考研究的主要研究基地。由机构知识图谱可发现部分研究机构间存在合作关系:例如,北京师范大学教育学部和未来教育高精尖创新中心、重庆师范大学外国语学院和英语周报社、安徽省淮北市实验学校和安徽省合肥市师范学校等。另外,高校与教研室和中小学之间已建立合作关系,如福建师范大学生命科学学院与福建省普通教育教学研究室、上海市闵行教育学院与上海市闵行区教育局、北部湾大学体育教学部与钦州市第六中学等。可以看出,研究基地的形成以及高校与基础教育机构间的合作,推动了研究的深化提升。
表1 发文量>=5篇的期刊及其类型
图2 研究机构知识图谱
依据普赖斯定律计算公式 M=0.749(Nmax1/2)[3],其中M指论文数量,Nmax指该领域中发文量最多作者的论文数量,当发文量在M篇以上、且核心作者的论文数量达到该领域论文总量的50%时,说明核心作者群已形成。根据统计结果可知,Nmax为7,将其代入公式可得M为1.83,即发表2篇以上的作者为该领域的核心作者。统计可知,本研究领域的核心作者有65位,发文148篇,占样本文献的20.64%,小于该样本文献的50%,因此初中学考研究的核心作者群尚未形成。其中,发文量3篇及以上的作者见表2。
对论文作者知识图谱(见图 3)和作者发文量的分析表明,初中学考的研究者主要包括高校教师、硕博士研究生、教研员和中学教师。其中,发文量最多的彭康洲主要研究中考英语试题质量,郑行军关注物理试题命制策略,邱广东关注中考数学试题评析,周永俐关注中考语文阅读测评,王克林关注中考化学试题评析。这五位作者为教研员或中学教师,他们更多的是从学科实践层面围绕初中学考试题进行微观研究。张雨强主要研究试题质量与难度预估、基于标准的学业成就评价,关注于学业成就评价的技术和学业水平考试方案;温红博关注于学业水平考试技术和工具的开发;杨向东主要研究学业水平考试的功能、设计和理论技术;崔允漷主要研究学业水平考试的功能和基于课程标准的学生学业成就评价;辛涛关注于学业水平考试的制度研究;缪琳通过构建本土化的“SEC”一致性分析模型,进行课程标准与中考题的一致性分析。根据分析可知,以上作者作为高校研究人员,更多的是从宏观层面进行学业水平考试的功能、制度和技术研究。通过作者知识图谱可见,研究者间的合作并不密切,合作规模仅为2-3人,合作的人数较少,尚未形成具有较强凝聚力的研究团队。
总体而言,初中学考研究以高校为主要研究基地,由高校教师、硕博士研究生、教研员和中学教师构成主要研究者,但尚未形成核心作者群。作者间的合作联系相对零散,尚未形成具有较强凝聚力的研究团队。
图3 作者知识图谱
2018年7月中共中央办公厅、国务院办公厅印发了《关于深化项目评审、人才评价、机构评估改革的意见》,指出要改进科技人才评价方式,推行代表作评价制度,注重标志性成果的质量、贡献、影响。研究论文的被引用次数反映了学界对于某领域代表性成果的关注程度,是体现研究成果学术价值和学术影响力的重要指标[4]。基于“被引频次”来识别标志性成果并评价其质量、贡献和影响,具有较强的可行性[5]。我国学界初中学考研究方面的被引频次最高的8篇样本文献汇总如表 3。
表3 2010-2019年发表初中学考研究被引频次前8位的论文分布
通过分析高频被引论文的研究内容可以发现,我国学界关于初中学考研究的学术影响主要集中在两方面:一是重视关于学业水平考试理论技术研究;二是紧密结合我国教育政策具体现状,试图通过对中国学业水平考试和国际大规模评价项目的对比研究,探索出适合中国国情和具有国际视野的学业水平考试评价方案和实施路径。另外,通过分析发文量高和被引频次高的作者可发现,二者并不完全重合,这也说明对于某一研究领域的分析需充分考虑质和量的关系,以便对本研究形成全面客观的认识。
关键词是文献研究主题、研究内容和研究方法的精炼表达,通过Cite Space软件可绘制关键词知识图谱(见图4),并统计关键词频数和中心性(见表4)。高频关键词能体现某一研究领域的前沿趋势和热点问题,也反映了研究者的关注度。高频关键词常被用来确定某一研究领域的热点问题[6]。
通过对图4和表4的分析发现,中考、课程标准、一致性、学业水平考试、试题编制、中考改革、核心素养、体育中考、中考数学、PISA、学科核心素养和内容效度等是研究者主要关注的关键词。关键词突现是通过CiteSpace软件的TF*IDF加权算法,“考察词频的时间分布,将那些频次变化率高、频次增长速度快的‘突现词’(burst term)从大量题录的常用词中检测出来”[7]。因此,关键词突现是通过词频变化趋势来分析研究热点及发展趋势,是对高频关键词的进一步聚焦。通过表4可知,试题编制、学业成就评价和内容效度是本研究的突现词。其中试题编制主要体现在2010-2013年,学业成就评价主要体现在2010-2011年,而内容效度主要体现在2017-2019年。这三个关键词作为突现的研究热点,反映了初中学考的研究前沿。
结合关键词共现知识图谱,进一步研读和分析相关文献,对初中学业水平考试的研究内容从研究取向、研究对象和研究方法三个方面进行阐述。
1.研究取向
任何学术研究都蕴含着一定的价值追求和目标诉求。就目前的初中学考研究而言,学者的价值取向可以归结为理论诉求和实践诉求两个方面。
表4 高频关键词频数和中心性统计
理论诉求层面,目前的教育研究偏重于理论思辨研究,由前述的被引频次分析可见初中学考研究的学术引领偏向于理论技术研究。笔者将结合相关文献和著作进行分析。钟启泉教授和崔允漷教授作为首席专家编著的《从失衡走向平衡:素质教育课程评价体系研究》一书为素质教育课程评价构建了哲学基础、社会和历史文化基础、心理学和测量学基础,提出将人性化评价作为素质教育课程评价体系构建的核心价值取向[8]。吴维宁主编的《新课程学生学业评价的理论与实践》中的理论篇介绍了引领当今世界学生学业评价潮流的哲学思潮、心理学的最新发展以及与评价密切相关的学习与教学理论[9]。辛涛探讨了教育测量理论新进展并预测增值评价和CD-CAT等将在未来的教育实践中发挥重要作用[10]。总体而言,学业水平考试的理论研究取得了一定成就,特别是在研究视角和研究方法方面有所突破,但关于初中学考的理论诉求层面的系统研究有待完善。
实践诉求层面,更多的是指向初中学考相关研究和现实情境中的诸多问题。例如,我国传统考试更多关注结果的可比较性和公平性,很少考虑对学习的加强和支持[11],现有的学业水平考试存在学业标准缺位、内容改革(选择)的思路欠清晰、试题编制和组卷未能遵循基本的教育测量原理、分类决策的过程欠科学、分数报道不能提供有用信息[12]、“两考合一”考试性质难以体现两种水平的命题要求、科目过多、考试形式略显单一[13]、学业水平考试成绩报告你科学[14]等问题。总体而言,初中学考的实践研究取得了一定成绩,辨明和理清了实践领域的一些模糊问题,有力推动了初中学考的深入研究。但在研究过程中存在一定的“唯实践”取向,需进行批判性分析和探讨,应明晰初中学考研究的独有价值和局限所在,从而促进其专业化发展。
2.研究对象
通过Cite Space软件的关键词聚类 (图5),共得到关于初中学考研究的六大主题:内容效度、试题编制、中考改革、一致性、体育中考、核心素养。结合二次文献阅读,将初中学考的研究对象合并归纳为中考制度、试题编制和学科教学三类,由此展开分析讨论。
图5 关键词聚类图谱
初中学考制度是一项重要的教育评价制度,建立以学生发展为目标的评价体系是我国考试制度改革的方向,是升学考试与招生制度改革的重要行动准则[15]。目前关于中考制度的研究主要涉及九个方面,包括考试性质与考试功能、考试组织、考试要求、考试科目命题的组织形式、结果的呈现方式、考试方式、各科目成绩计入总分的方式、考试次数和普通高中录取依据[16]。由于中考是连接初中和高中两个教育层次的“中介”,引导着义务教育阶段的发展方向,并奠定了高中教育的发展基础,因此,不断完善中考制度是众多研究者致力的方向。例如,沈玉顺从教育评价学角度分析了中招考试制度改革涉及的政策因素,提出应以质量和效率为导向统筹考虑初中毕业考试和中招考试制度改革[17];李震利用新制度主义理论对湖北省中考制度变迁过程中出现的认同困境、动力欠缺、效率不高等问题进行分析并提出意见建议[18]。需要指出的是,在明确初中学考的价值功能基础上,仍需持以辩证批判的眼光进行理性研究。中考可以通过引导教育而影响城乡的人力资源配置,但单靠中考制度的改革来解决城乡矛盾,显然是不现实的。由于教育评价制度能够引导教育的发展,因此中考的改革势必会影响中小学教育的内容及方式,其实施需极为慎重。学业评价制度的改革应着眼全局,多元考虑[19]。
试题编制是将关键词聚类里的试题编制、内容效度和一致性合并讨论的,因为这三个主题都聚焦于命题技术、命题策略和试题分析等。初中学考的命题技术研究主要集中在试题编制的原则、试题编制程序(澄清测验目的、规定测试范畴、制定细目表、确定试题格式与编题、审查题目、试测题目编写使用手册)[20]、试题编制模型的开发、试题编制框架与细则开发和试题质量保障工具开发[21]五个方面;命题策略的研究主要集中在试题素材的选用、实验命题、原创试题、组合型试题和试题改编五个方面。在诸多研究中,不乏专注于某一命题的关键技术和策略的分析,如孙月圣阐述依据项目反应理论进行试题编制的具体过程和结果,总结和梳理该试题编制方式存在的优势和不足,探讨试题编制过程进一步优化的设想[22];邱荣槐通过分析一道中考地理选择题,指出编制素养立意的试题,设计任务情境是关键,同时要研制素养水平和任务表现相关联的评分标准[23]。需指出,随着基于核心素养的课程改革,命题技术由面向考纲双向细目的命题变为面向9年积累、能力素养的命题[24]。试题分析包含试题的难度、区分度、效度和信度,相关研究主要从三个方面展开:基于多种测量理论(项目反应理论、经典测量理论、概化理论、SOLO分类理论)的命题质量分析[25]、基于波特、Achieve、SEC、Webb分析模型的中考试题与课程标准一致性分析[26,27]、基于学科素养的描述性分析。研究中也指出了建立大规模考试试题库的必要性[28]。作为突现关键词内容效度的相关研究,主要集中在英语学科的多种题型,通过分析测试内容的覆盖面、测试技能的代表性以及测试内容的相关性明确其内容效度[29],进而对中考命题和教学提出建议。总体而言,关于试题编制的研究既有上位的理论技术支撑,也有深入学科内部的实践,我国相关研究人员也在不断开发本土化的命题策略,如山西省从2015年开始中考命题改革,已逐步形成命题“六个维度”并不断深化[30]。
学科教学是充分发挥学考育人导向的重要路径。初中学考在考试理念、内容和形式上的转变促使学科教学不断变革。例如,从2018年开始北京市中考科目分为必考与选考科目,更加关注教学导向和实际需要,并以初中思想政治课为例说明基于新中考的教学策略:教学依据是学情、教材、课标和考试说明、考情、核心素养;教学实施分为分层教学、1对1数字化教学、合作学习、时事教育、文化熏陶和综合实践活动;教学评价包含观察性评价、作业评价、项目评价、考试评价和成长记录[31]。通过对中考题的分析,不同学科都提出了情境教学的重要性,并展开深入研讨和实践。理科实验技能操作在各地初中学考中的重要性程度不断提升,如在山东潍坊实验操作已作为考试科目全市统一命题、监考、评价并计入中考成绩,这也“倒逼”了实验教学理念和方式的转变。总体而言,学科教学的研究视角多元化,以经验总结性研究为主,但也有研究开始运用新技术更具针对性地促进学生的学[32],研究并实践中考与教学相互促进的模式[33],一线教师和教研员已经成为该研究主题的中坚力量,为基于初中学考的学科教学研究积累了丰富的素材和经验。
3.研究方法
以上从初中学考制度、试题编制和学科教学三个方面探查初中学考的研究对象,考虑到研究对象相对平面、孤立,有必要将研究视角横移、纵移,梳理初中学考比较研究与实证研究方面的文献,这两方面文献的研究方法主要为比较研究法和调查研究法。
比较研究法主要集中在国际大规模评价项目与初中学考的比较研究和基于学科的市域比较研究。在已有研究中涉及的国际大规模评价项目包括PISA、TIMSS、美国 NAEP、加拿大 PCAP、英国 NCA、澳大利亚NAP-SL和新西兰NMSSA。其中,国际学生评估项目(Programme for International Student Assessment,简称PISA)是初中学考比较研究的核心项目,研究以PISA所倡导的“素养观”为切入点,对比分析考试内容、问题情境、命题过程、阅卷程序等,进而对我国评价理念、教育教学、试题编制与评价程序等方面提供有益启示。基于学科的初中学考比较研究深入学科内部,体育学科从宏观层面对中考方案包含的12项内容进行对比分析,为各地市制定公平公正、科学合理的体育中考方案改革提供重要理论依据和参考意见[34]。其他学科的比较研究,则专注于某一知识模块或考试题型进行不同年份、地域的比较,分析命题思想与原则、考查目标、考查内容和考查形式等,总结命题特点,预测命题趋势,提出教学建议。总体而言,初中学考比较研究虽积累了一定成果,但深度不够,研究者多是针对初中学考的某一层面展开研究,并未对初中学考的社会背景、评估制度、评估开发程序等进行深入、系统、完整的对比讨论。
调查研究法主要集中在体育中考和中考对教学的反拨效应两个方面。体育中考主要调查体育中考改革对初中体育教学目标、教学方法、教学内容、教学评价和教学条件所产生的影响,以及改革过程中所产生的问题和原因并提出改进策略[35]。有研究聚焦于农村体育中考成绩、项目的设置、相关人员对体育教育的重视度展开调查,并提出建议[36]。反拨效应(washback/backwash)又称反拨作用,通常指考试对教师和学生以及教和学产生的影响[37]。研究根据Alderson&Wall的反拨作用假设理论,聚焦于初中教师对新课程标准的掌握状况,以及中考对教学诸方面产生的影响,设计调查问卷并进行统计分析[38]。总体而言,调查研究法在初中学考研究中发挥了一定作用,但研究局限性较强,相关研究主要集中于体育和英语学科,缺乏对不同学考科目的调查研究,且多是针对调查结果的应然分析,缺乏深入微观层面的剖析和验证。
通过运用Cite Space绘制知识图谱、文献计量法和内容分析法等方法,对近10年初中学考研究成果进行了不同层次的可视化研究和分析,得出以下研究特点。
第一,初中学考研究从2015年进入快速增长期,未来研究热度将会持续保持。研究以“学科类”教育期刊为主要发文期刊,以高校为主要研究基地,由高校教师、硕博士研究生、教研员和中学教师构成主要研究者,但尚未形成核心作者群。作者间的合作联系相对零散,尚未形成具有较强凝聚力的研究团队。
第二,通过被引频次分析可发现,我国学界关于初中学考的研究主要集中在学业水平考试理论技术研究以及与国际大规模评价项目的对比研究。
第三,初中学考研究主要围绕中考、课程标准、一致性、学业水平考试、试题编制、中考改革、核心素养等关键词展开,其研究内容包含研究取向、研究对象和研究方法。其中,研究对象是主体,包括中考制度、试题编制和学科教学。
1.充分发挥研究机构与研究者的各自优势,促进初中学考研究的良性循环
参与初中学考的研究机构较多,主要研究者为高校教师、教研员和中学教师,他们各自有着独特的研究优势,也存在明显弊端。高校研究者的理论水平高,研究规范,更多关注学业水平考试的功能、制度和技术研究,但相对缺乏实践性,对一线课程与教学的指导性较弱。教研员与中学教师的研究更贴合实践,主要从学科实践层面围绕初中学考试题进行微观研究,研究的经验色彩较重,缺乏理论性,规范性亦有待提高。因此,在已有研究基础上,需要加强宏观引领,建立保障机制,促进研究机构、研究者之间的合作,形成核心研究团队,提高初中学考研究质量的层次和水平。
2.增强研究取向的关联性,促进学考研究的专业化发展
研究在理论思辨研究和实践性研究层面都取得了一定成就,但学术影响更侧重于理论技术研究。由于初中学考研究所具备的实践属性,理清和辨明实践领域的诸多问题又是学考发展的必经之路。因此,研究中应坚持关联性或融合性的研究取向。具体而言,研究在着手理论层面和实践层面的关联研究时,需明确理论和实践研究是关联研究的基础,不能忽视理论研究和实践研究之间的差异性和相对独立性;而关联研究是理论和实践研究的深化,在注重理论和实践自主性的同时,关注二者的相互联系和沟通。在现实的研究中,根据研究问题有选择地侧重与融合。
3.拓展研究对象,丰富研究维度,促进初中学考与不同专业领域的交叉研究
现有研究多从教育学领域展开,其研究对象的深度和广度存在较大的局限性,而开展初中学考与其他专业领域的交叉研究是促进其发展和完善的必经途径。如中考制度研究可以从哲学领域分析初中学考的目的和功能,以便形成宏观认识;从社会学领域分析考试组织,以促进学考公平性;从心理学领域分析考试要求、考试次数、招生录取依据,以明确不同的考试要求、次数和录取依据对学生造成的考试负担以及建议措施;从测量与评价领域分析考试命题、结果呈现,树立现代考试质量理念,以教育测量学理论指导考试实践,运用教育测量方法和技术提升考试和命题的专业化[39]。
4.强化研究方法的应用,提升初中学考研究的深刻性
一方面,学业水平考试具有“高利害”性,也是世界各国在教育评估中必然考虑的重要因素。通过比较研究能够借鉴国外成功案例的优秀做法,找到规律性和共同性,同时规避不合理举措。同时,由于中考在我国不同地域有着相对自主性,因此,地域之间的比较分析亦有利于推动整体发展。另一方面,初中学考本身的实践属性,决定了研究的发展方向必需通过实证调查,实事求是,提出具有针对的策略和建议。初中学考的调查研究比较薄弱,与高中学考相比差距颇大,因此,在明确初中学考独特性的同时,学习借鉴高中学考的调查研究,是提升初中学考调查方法应用的有效途径。