Cathy Wendler Barbara Kirsh
(美国教育考试服务中心,美国新泽西州普林斯顿 08541)
冯采译
(北京师范大学,北京 100875)
理解和运用《教育与心理测试标准》
——ETS的案例研究
Cathy Wendler Barbara Kirsh
(美国教育考试服务中心,美国新泽西州普林斯顿 08541)
冯采译
(北京师范大学,北京 100875)
《教育与心理测试标准》由美国心理协会(APA)、美国教育研究协会(AERA)和美国国家教育测量协会(NCME)联合制定,美国教育考试服务中心(ETS)仿效《教育与心理测试标准》,制定了《ETS质量和公平标准》。本文介绍这两套标准的制定过程以及历史发展,《ETS质量和公平标准》的理念以及在ETS考试产品中的应用。
测试标准;教育和心理测试标准;ETS质量和公平标准
许多行业和机构都有专业标准。为什么需要专业标准?一般而言,这些标准的设计旨在帮助确保产品的可靠性和一致性,旨在促进公平、道德和对这些产品的有效利用,旨在提供评估产品的基本原则。因此,标准是为在特定领域工作的人提供指导、帮助开发产品以及在相关领域使用产品。有些领域(如医学、教学或工程等)有政府法规,但是在测试领域却没有指导实践的政府法规,因此,涉足测试领域的机构自行制定了一系列的指南和标准。
在教育和心理测试领域,标准和指南已经存在了几十年。许多标准和指南反映了测试环境在不断变化。这些标准和指南重点关注测试开发和使用的具体问题,例如:公平的测试实践和道德行为标准[1-4],测试开发和改进方法标准[5-8],考生的权利和责任标准[9],测试使用标准[10-11]。
指导测试开发和使用最著名和应用最广泛的标准是由美国三家涉及测试的专业机构制定的,这三家机构是美国教育研究学会(American Educational Research Association,AERA)、美国心理学会(American Psychological Association,APA)和美国国家教育测量委员会(National Council on Measurement in Education,NCME)。多年来,这三家机构合作倡议、创建和修订了有关教育和心理测试领域的标准,这些标准以《教育与心理测试标准》(Standards for Educational and Psychological Testing)一书呈现[12]。
若干早期的文件对目前《教育与心理测试标准》的制定起到了指导作用[12-13]。1954年,APA颁布了《心理测验和诊断方法的技术建议》文件,该文件由APA的一个委员会撰写,用以指导心理测验的开发和使用。AERA和美国国家教育测量使用委员会(National Council on Measurements Used in Education,NCME的前身)也创建了一个委员会,撰写了《成就测验的技术建议》(Technical Recommendations for Achievement Tests)文件,该文件由美国国家教育学会(National Education Association,NEA)于1955年颁布[14]。这个文件的重点是指导成就测验的开发以及为分数使用者提供的报告类型上。
20世纪60年代,APA、AERA和NCME设立了一个联合委员会,其成员由代表三家机构的人员组成。他们的任务是起草一个既适用于心理测验又适用于成就测验的标准文件。1966年,《教育与心理测验标准和使用手册》(Standards for Educational and Psychological Tests and Manuals)颁布,取代了1954年和1955年的文件[15]。这个文件代表了三家学会的第一次合作,此后,这三家学会又联合开发了其他4个版本的《教育与心理测试标准》。
第二版于1974年出版[16]。这一版的内容得到扩展,不仅包括测试开发和文件指南,还包括测试使用和成绩报告。此外,还介绍了用于其他领域的测试标准,如求职和大学入学测试。书的标题也缩简为《教育与心理测试标准》。
到1977年,测试领域出现了新的问题,包括技术进步、测试的新兴用途以及不断提高的对测试在社会中的作用的关注。这些表明,标准需要进一步修订。为直面这些关切,对1974年版的《教育与心理测试标准》再次进行了修订。另外,本次修订也特别关注了有关效度理论的各种观点。
1985年修订的《教育与心理测试标准》将效度视为统一概念[17],同时仍认可不同类型的证据适用于不同类型的测试成绩的解释和使用[18-19]。
1999年版的《教育与心理测试标准》则是对1985年版的进一步修订,提出此次修订建议的是APA的心理测验和评价委员会。作为这次修订的一部分,“测验”的定义扩大到包括更大范围的评价范畴[13]。1999年版的标准还探讨了测验在决策过程中的使用问题:“测验的恰当使用比不使用能获得关于个体和项目的更明智的决策。”[20]
Plake和Wise对2014年版的《教育与心理测试标准》的修订过程进行了详细的描述[13]。为监督《教育与心理测试标准》的出版和预算,成立了由三家学会的代表组成的管理委员会。这一版本的修订工作始于2004年,应管理委员会的要求,向三家学会的相关人员征求修改意见。2007年,收集到修改意见,由三家学会的代表组成的联合委员会负责修改《教育与心理测试标准》。
当时,人们认为以下方面需要修订:1)无障碍性和公平性;2)在问责中使用测试;3)技术的影响;4)职场涉及的测试问题;5)《教育与心理测试标准》本身的形式。此外,一些重要关切需要回应。例如,《教育与心理测试标准》的目标人群,是否应涵盖课堂评估,以及三家学会观点的哲学差异,这些都将直接影响修订版的形式和内容。
测试及测验结果的使用会影响个人,很多关于个人、教育项目甚至机构的决策都来源于测验结果。因此,2014年修订版的一个目标就是,确保非测量专业的读者也可以明白《教育与心理测试标准》。因此,这次修订也为这些读者加入了额外的背景和信息[13]。
尽管所有版本的《教育与心理测试标准》(从20世纪50年代的初始文件到现在的版本)都是从美国的角度出发撰写的,但Plake和Wise表示,2014年版的目的是适用于广泛的读者[13]。例如,Zumbo讨论了标准的国际适用性,并认为这些标准在全球的测试领域发挥了关键性的作用[21]。因此,无论是应用于各种测试,还是在不同的国家环境,这些标准对测试实践的意义都是不可忽视的。
这三家学会成员的意见在修订中发挥了至关重要的作用。修订委员会还几次对《教育与心理测试标准》的不同草稿公开征求意见,最终稿提交各学会审批。每家学会都有自己的审批程序,最终都批准了这次修订[12]。
《教育与心理测试标准》旨在适用于心理学、教育学及其他领域(如执照和证书)的专业人员。Plake认为,标准为解决测试领域的法律、伦理和实质性问题提供了指导[22]。因此,《教育与心理测试标准》被解释并用作在许多情况下的指导原则,包括测试机构在实际工作中用它指导测试开发和成绩报告[23],用于职业测试和专业认证领域[24],从事教育测量问题研究[25],甚至用在某一国际环境中[21]。《教育与心理测试标准》还为其他在决策中使用测试成绩的个人(包括政策制定者、学校行政人员、政府官员)以及教师、医生和律师的专业认证机构解释了基本的测量概念,如效度、信度和公平性。
《教育与心理测试标准》由引言和三部分内容组成。“引言”阐述标准的目的,描述了对1999年版《教育与心理测试标准》所作的主要修订,概述了该书的形式,并详细列出了各项标准适用的测试、测试用途及参与者。其余三个部分涵盖了各项标准,这些标准被分为13章。每章开头为介绍性文字,描述了解释和恰当地使用各项标准所需的关键概念。各项标准还被归类为与特定主题相关的标准簇。这三个部分的内容如下。
第一部分:基础。这个部分所含的标准举例说明了心理测量的必要特性,这些特性存在于多种类型的测试环境的所有测试中。第1章:效度,包括测验结果的使用和解释、效度验证中的样本和背景,以及效度证据的具体形式;第2章:信度/测量精度和误差,包括复制测试程序、记录和评估信度/精度、影响信度/精度和测量标准误的因素,以及决策的一致性;第3章:测试公平性,包括最大限度减少妨碍有效分数解释的因素、为清除与构念无关的因素所作的安排,以及防范不当分数解释。
第二部分:操作。这个部分包含与设计、管理和成绩报告相关的活动和过程的标准。与第一部分一样,这些标准适用于各种测验和测试环境。第4章:测验设计与开发,包括测验说明、命题、题目审查、考务和评分程序,以及测验修订;第5章:分数、量表、常模、分数关联及分数线,含分数解释;第6章:施测、评分、分数报告和解释;第7章:测验的支持性文件,包括文件的恰当使用、作为测验开发组成部分的文件、施测、评分,以及文件发布的时效性;第8章:应试者的权利与责任,包括测试前的准备、防止以未经授权的方式使用测试结果、获取公平和准确的分数,以及整个测试过程中的预期行为;第9章:测验使用者的权利与责任,包括分数解释的有效性、测验结果的发布、测验安全以及版权保护。
第三部分:测试的应用。这个部分描述适用于特定测试环境的标准。虽然这些特定环境中使用的测试也应遵循第一部分和第二部分的标准,但第三部分的标准是针对特定测试环境的附加标准。这些标准涉及的问题包括测验的设计、开发和使用,考务、评分和分数报告,测验选择,以及测验使用者的资格。第10章:心理测试与评价;第11章:职场测试与资格认证;第12章:教育测试与评价;第13章:测试在项目评估、政策研究及问责中的使用。
2014年版《教育与心理测试标准》反映了三家机构所信奉的什么是测试设计、实施和使用的最佳实践,以确保测试结果对所有考生群体都是有效、可靠和公正的。然而,《教育与心理测试标准》在测试领域之外的应用是有限的。例如,Pullin报告说,《教育与心理测试标准》在法院案件或政策制定和实施中最多只是一个变量。尽管《教育与心理测试标准》可能影响法院的判决或决策者的决定,但它的使用通常并不明显[26]。
另外,并没有任何机制保证《教育与心理测试标准》能够确保测试公司、测验使用者以及其他个人在测试开发、施测、成绩报告和测验结果的使用过程中能恰当地应用这些标准。《教育与心理测试标准》没有说明滥用测验或不遵循标准可能导致的结果,也没有解释在实施过程中如何使用和应用这些标准。尽管《教育与心理测试标准》指导人们开发测试、评分和报告测试结果,但它只提供一般性指导,并没有阐述应当运用的技术和心理测量标准。因此,一些测试公司创建了自己的一套标准来指导内部运作。例如,《ETS质量和公平标准》(ETS Standards for Quality and Fairness)就是《教育与心理测试标准》的操作说明。
《ETS质量和公平标准》(以下简称《ETS标准》)反映了教育考试服务中心(Educational Testing Service,ETS)测验和产品的具体属性,并与ETS所做的工作保持一致,这些标准用于界定ETS工作的基准,包括测验和题目的开发、心理测量学、分数报告、测验发送系统、客户服务以及其他生产活动[27]。
早期版本的《ETS标准》被称为《原则、政策和程序指南》,主要来源于《教育与心理测试标准》。这些早期的ETS文件以非正式的方式指导了ETS测验和其他产品的开发。20世纪80年代,ETS领导层指出,《ETS标准》在未来应与专业的测量标准(即《教育与心理测试标准》)保持一致。1981年,《ETS标准》第一版发布,后续的修订版本都与《教育与心理测试标准》的修订基本保持了一致。为什么需要两套标准?虽然早期和目前的《ETS标准》与《教育与心理测试标准》相似,但多年来,ETS版本试图与《教育与心理测试标准》有所区别。例如,《ETS标准》包括企业层面的要求,即促进科学测量,承认ETS对顾客、客户和其他利益相关者的责任。《ETS标准》还制定了一些反映ETS使命的标准,即通过提供公正有效的评价提高教育质量和公平性,保护知识产权和客户隐私,并以科学的业务流程来防范重大事故。
《ETS标准》指导ETS的实际工作,包括《教育与心理测试标准》中没有包含的信息,例如与非测试产品和服务相关的资料。《ETS标准》还剔除了包含在《教育与心理测试标准》中但不属ETS工作范畴的一些信息,如临床心理学家进行的个人心理测试。《ETS标准》是为ETS工作人员使用而设计的,因此无须满足《教育与心理测试标准》所涉及的其他测试人员(如项目评估人员,州级和区域测试主管以及心理学家)的需求。此外,《教育与心理测试标准》往往对测量方法有更多的规定,而《ETS标准》更强调希望得到的结果,而非规定如何取得这些结果。表1比较了《ETS标准》与《教育与心理测试标准》的文本结构。
《ETS标准》自1981年启用之后,分别于1987年和2000年发布其修订版,2002年又进行了微调,最近一次修订完成于2014年。十年间,尽管ETS产品发生了变化,2002年版《ETS标准》仍能适用于ETS的一系列产品。然而,测量领域的变化以及人们对2014年版《教育与心理测试标准》观点的变化需要《ETS标准》作进一步修订。2014年版的《ETS标准》更新了一些标准,目的是:1)更适用于测试领域的技术变革(如在线考试报名、付款以及备考资料,在测试中广泛使用各种数字设备,自动评分);2)反映问责在教育考试的使用;3)更加关注非英语母语者和残障人士。
2014年版《ETS标准》的修订过程与2014年版《教育与心理测试标准》很相似。ETS成立了一个内部的标准指导委员会评论《教育与心理测试标准》的公开草稿,并根据该公开草稿考虑2002年版《ETS标准》所需的变化。标准指导委员会还汇总了ETS对《教育与心理测试标准》公开稿的意见,并提交给AERA、APA和NCME联合委员会。
ETS内部标准指导委员会由来自ETS的几个领域的15名员工组成,主要为研发部门人员,其中有两名成员也参与了2014版《教育与心理测试标准》的修订和撰写。有些委员会成员负责根据对《教育与心理测试标准》公开草稿的审读意见以及来自ETS各领域工作人员的意见修改《ETS标准》中的具体章节。
表1《教育与心理测试标准》和《ETS标准》的文本结构比较
这些努力的目的是制订一份能灵活应用于ETS所有产品的文件,并能成为未来10~15年的指导性专业标准。新的《ETS标准》需要具有足够的灵活性,以保证在可预见到的技术、人口以及教育和测量环境等方面发生变化时仍能提供良好的服务。同时,该文件的内容要清晰、具体,以指导测试项目实践,并使ETS员工能够评估这些实践。这些标准还要可实施,适合ETS所有产品,并支持创新和新产品的开发。最后,《ETS标准》需要表明,对广大外部利益相关者(包括考生、研究人员、客户、媒体和公众)而言,ETS产品是遵循专业测量标准的。
与《教育与心理测试标准》一样,2014年版《ETS标准》也包含13章,每章包含与特定领域相关的一套具体标准。有些章节着重于技术标准,如效度、信度、等值和公平性,其他章节侧重于重要的非技术性问题,如施测、测验使用和安全问题。
第1章、第2章和第5章适用于所有产品,包括测验和非测验产品。第3章包含与非测验产品(用于指导、教学或备考,而不是评估个体)相关的标准。其余章节适用于评价及与测验相关的活动。这些章节适用于所有类型的测验,包括纸笔测验、计算机测试、表现性评价以及使用多媒体发送的测试。除了更传统的多项选择题和主观题的测验之外,这些章节也适用于基于评估结果而进行决策的任何类型的评估,例如基于游戏的测验、问卷调查和非认知测试。各章的内容如下。
第1章:企业责任,包括适用于ETS所有活动的企业层面的标准,例如支持ETS使命、法律遵循、了解客户需求以及对产品的一般责任。
第2章:广泛适用的标准,包括适应许多其他标准的标准。这些标准包括准确和清晰的表达、文件记录决策、为确保测试结果解释恰当的抽样方法的考量以及确保称职的专家参与产品开发。
第3章:非测试产品及服务,用于与非测试产品相关的标准(如备考产品、指导产品和教师使用的教学产品)。本章中的标准有助于确保非测试产品和服务按照预定的方式服务目标人群,且它们是根据计划和文件规定的流程进行开发或修订的。非测试产品和服务同样有责任遵循第1章、第2章和第5章的标准。
第4章:效度,包括与收集适当的证据以支持测试项目对于如何使用测试结果以及使用后果的声明有关的标准;还包括与识别构念无关因素相关的标准,这些无关因素可能影响测试分数解释的效度。
第5章:公平性,展示确保所有测试、产品和服务公平的标准。公平性是一个包罗万象的概念,包括要考虑ETS测试和产品所服务的不同人群,如残疾人、英语语言学习者、来自不同族裔群体的人、性取向、年龄组以及个人信仰。公平的概念应用于整个测试过程,包括测试的设计、开发、实施、评分和分数报告。
第6章:信度,有助于保证分数或测试结果对其预期目的具有足够的可靠性的标准。这些标准还有助于确保采用恰当程序来判定信度并提供证据。第4章和第6章都未提出具体应该使用何种类型的方法,也未确定信度与效度的最低可接受水平,需要由为项目工作的专家作出判断。
第7章:测试的设计与开发,包括与测试的设计和开发相关的标准。这些标准有助于确保测试是使用有计划、有据可查的程序开发的;这些程序使测试为其预期目的及目标人群提供公平、可获取、可靠和有效的分数解释。开发人员要按照详细的说明开展工作,获取对他们工作的评论,使用有关试题和测验质量的实证信息,并对测验进行评估。
第8章:等值、关联、常模及分数线,包括与程序相关的标准,这些程序有助于确保意在可比的测验分数是可比的,常模数据是有意义的,并且分数线的研究遵循合理、清晰的描述程序。本章没有规定一个项目应该使用何种分数量尺,也没有提出等值、关联或设定分数线的具体方法。
第9章:测验实施,包括有助于保证测验以适当方式实施的标准,以提供准确、可比和公正的测量。实施程序(包括所需的安全级别)随测验的性质和目的而变,但是本章也未具体给出任何一个测验的准确程序。然而,无论使用何种施测平台或设备,本章中的标准对任何测验都是适用的。
第10章:评分,有助于确保测试项目的建立、记录,以及所遵循的程序使应试者的作答得到准确、一致的评分。一个测试的所有任务和题型(不管是多项选择题、主观题或复杂表现题,也不管是人工评分还是机器评分)都应遵循有据可查的程序,并进行准确性审查。
第11章:报告测试结果,这一章的标准有助于确保分数、测验结果以及说明性信息对其受众而言是清晰、易理解和有意义的。这些标准并不限制测验结果的报告方式。
第12章:测验的使用,包括与如何使用测试有关的标准。这些标准有助于促进正确使用测试,并帮助分数接收者公平和适当地使用测验。
第13章:应试者的权利与责任,有助于确保应试者明确自己的权利和责任,并明确在测试的任一阶段他们的权利是受到保护的。其他章节(如第5章、第9章和第11章)中的有些标准也涉及应试者的权利。
《ETS标准》一经采纳便被应用于ETS所有产品。与没有保障机制或程序的《教育与心理测试标准》不同,ETS要求所有产品都要经由系统性的审查流程来评估其是否符合《ETS标准》。这种审查过程采取内部审核的形式,并确定各个产品(包括测验和非测验)是否在事实上真正符合《ETS标准》。内部审核是ETS提供产品和服务公共问责不可缺少的一环。
审核过程有助于确保开发和维护高质量测验和产品。内部审核使用统一、有文献可查的程序对产品进行评估。审核过程包括多个步骤;在这个过程中,要共享并审查信息,而且要对每一个接受审核的测验或产品提供反馈。ETS专业标准遵循办公室(ETS Office of Professional Standards Compliance,OPSC)负责监督和管理整个审核流程,制定计划,以使项目和产品能够得到定期审核。
在审核过程中,要系统地应用标准对测验或产品进行评估。由不同的ETS专业人员组成的审核团队负责这项任务。审核人必须独立于被分配审核的测验或产品。虽然不期望每个审核人具备所有与《ETS标准》相关的各项知识,但作为一个团队,审核人员必须具备所需的知识和经验,以便对产品是否遵守各项标准进行必要的判断。因此,《ETS标准》的解释和应用依赖于ETS员工的专业判断。虽然《ETS标准》提供了专业判断的依据,但并不能代替这一判断。
针对《ETS标准》和审核过程本身,ETS要向审核团队成员以及产品所有者提供特别培训。产品所有者负责确保他们的测验和产品符合《ETS标准》。他们要完成自我评估,以显示他们的测验和产品是如何符合每项标准的,并准备文件为之提供证据。审核人员审查这些自我评估及其支持性文件,并以小组的名义起草一份关于各项标准符合程度的报告。如果审核人员认为一个产品或者测验不符合某一特定标准,他们必须解释为什么,并提出解决这个问题的适当建议。审核人员和产品所有者之间要进行讨论,形成一个最终报告和一个修补所有有缺陷之处的计划。这是一个全面而有效的审核过程。
在特定审核周期内,要向ETS领导层提交一份所有产品和测验评估主要结论的报告。ETS高层的参与保证了对《ETS标准》给予的最高级别的关注。若产品所有者没有在合理时间内解决违反标准的相关问题,则可能导致严重后果,包括停止产品或测验。在某些情况下,测验或产品可能由ETS外部的客户拥有。虽然客户制定的政策不一定必须受产品所有者直接控制,但如其政策违反专业标准,产品所有者仍然有责任通知客户。
总之,《教育与心理测试标准》通过描述测量领域的最佳实践来指导那些正在开发或使用的测验。这些标准对各种类型的测验、测试环境和测验用户都非常有用。然而,它们是在一般化的层次上制定的,因而不能直接适用于实际工作。因此,ETS制定了《教育与心理测试标准》的操作例示,既与之一致,又反映了ETS开发的那些测验和产品的类型。通过内部审核程序,《ETS标准》的应用得到系统监控,以确保所有产品和测验符合标准。
《ETS标准》帮助ETS员工理解ETS每个测验或产品所必须遵守的准则。这些标准反映了ETS致力于生产高质量的测验和产品的承诺,即生产公平、有效、可信的测验和产品。
[1]Joint Committee on Testing Practices.Code of Fair Testing Practices in Education[M].Washington,DC:Author,1988.
[2]Joint Committee on Testing Practices.Code of Fair Testing Practices in Education[M].Washington,DC:Author,2004.
[3]American Counseling Association.ACA Code of Ethics[M].Alexandria,VA:Author,2014.
[4]American Psychological Association.Ethical Principles of Psychologists and Code of Conduct[M].Washington,DC:American Psychological Association,2010.
[5]Educational Testing Service.ETS guidelines for fairness review of assessments[EB/OL].[2017-06-30].http://www.ets.org/about/fairness.
[6]Educational Testing Service.Guidelines for the Assessment of English Language Learners[EB/OL].[2017-06-30].http://www.ets.org/ about/fairness.
[7]Educational Testing Service.ETS international principles for the fairness of assessments[EB/OL].[2017-06-30].http://www.ets.org/ about/fairness.
[8]International Test Commission.ITC Guidelines for Translating and Adapting Tests[EB/OL].[2017-06-30].http://www.intesetcom.org.
[9]Joint Committee on Testing Practices.Rights and responsibilities of test takers:Guidelines and expectations[M].Washington,DC:Author,1990.
[10]Society for Industrial and Organizational Psychology,Inc.Principles for the validation and use of personnel selection procedures [M].College Park,MD:Author,1987.
[11]American Federation of Teachers,National Council on Measurement in Education,&National Education Association.Standards for Teacher Competence in Educational Assessment of Students [EB/OL].[2017-06-30].http://buros.org/competency-standardsstudent-assessment-educational-administrators.
[12]American Educational Research Association,American Psychological Association,&National Council on Measurement in Education.Standards for Educational and Psychological Testing[M]. Washington,DC:American Educational Research Association, 2014.
[13]PLAKE B S,WISE L L.What is the role and importance of the revised AERA,APA,NCME Standards for Educational and Psychological Testing?[J].Educational Measurement:Issues and Practice, 2014,33(4):4-12.
[14]American Educational Research Association&National Council on Measurements Used in Education.Technical recommendations for achievement tests[M].Washington,DC:National Education Association,1955.
[15]American Psychological Association,American Educational Research Association,&National Council on Measurement in Education.Standards for Educational and Psychological Tests and Manuals[M].Washington,DC:American Psychological Association, 1966.
[16]American Psychological Association,American Educational Research Association,&National Council on Measurement in Education.Standards for Educational and Psychological Tests[M].Washington,DC:American Psychological Association,1974.
[17]American Educational Research Association,American Psychological Association,&National Council on Measurement in Education.Standards for Educational and Psychological Testing[M]. Washington,DC:American Psychological Association,1985.
[18]KANE M T.Validation[M]//Educational Measurement.4th ed. Westport,CT:American Council on Education and Praeger Publishers,2006.
[19]MESSICK S.Validity[M]//LINN R L.Educational Measurement. 3rd ed.New York:American Council on Education and Macmillan, 1989.
[20]American Educational Research Association,American Psychological Association,&National Council on Measurement in Education. Standards for Educational and Psychological Testing[M].Washington,DC:American Educational Research Association,1999:1.
[21]ZUMBO B D.What role does,and should,the test standards play outside of the United States of America?[J].Educational Measurement:Issues and Practice,2014,33(4):31-33.
[22]PLAKE B S.Ready for member comment:Revised Standards for Educational and Psychological Testing[J].Educational Researcher, 2011(40):33.
[23]CAMARA W J.Issues facing testing organizations in using the Standards for Educational and Psychological testing[J].Educational Measurement:Issues and Practice,2014,33(4):13-15.
[24]SACKETT P R.An employment testing and credentialing perspective on the Standards for Educational and Psychological Testing[J]. Educational Measurement:Issues and Practice,2014,33(4):22-24.
[25]SINHARAY S,RIJMEN F,CHOI S,DORANS N.The revised standards and its role in research on educational measurement[J].Educational Measurement:Issues and Practice,2014,33(4):36-37.
[26]PULLIN D.Professional testing standards in the eyes of the law[J]. Educational Measurement:Issues and Practice,2014,33(4):19-21.
[27]Educational Testing Service.ETS Standards for Quality and Fairness[EB/OL].[2017-06-30].http://www.ets.org/about/fairness.
Understanding and Applying theStandards for Educational and Psychological Testing: A Case Study of How the Standards are Applied at Educational Testing Service
Cathy WENDLER,Barbara KIRSH
(Educational Testing Service,Princeton,NJ 08541,USA)
The book,Standards for Educational and Psychological Testing,was developed jointly by three preeminent American-based organizations involved in testing:the American Psychological Association,the American Education Research Association,and the National Council on Measurement in Education.This article briefly presents the history of these standards and the process by which they were developed.Educational Testing Service(ETS)has created its own set of standards,theETS Standards for Quality and Fairness,modeled on theStandards for Educational and Psychological Testing.The rationale for and process of creating the ETS standards and their use at ETS are also described in this article.
Standards for Testing;Standards for Educational and Psychological Testing;ETS Standards for Quality and Fairness
陈宁)
G405
A
1005-8427(2017)10-0027-9
10.19360/j.cnki.11-3303/g4.2017.10.005
Cathy Wendler,美国教育考试服务中心,博士;Barbara Kirsh,美国教育考试服务中心,博士。