美国高校学生学习结果评估框架分析

2021-03-24 10:52谢晓宇

高教探索 2021年2期

摘要：20世纪80年代中期，伴随着高等教育评估由关注教育投入转变到关注教育产出，学生学习结果评估引起社会的广泛关注。美国高校是学生学习结果评估的先行者，尽管认证机构没有制定统一的评估框架，但已经制定评估框架的高校证明它确实能够成为开展良好评估实践的催化剂。通过已有的评估实践发现，评估框架主要包括四个方面：制定学习目标、基于学习目标设置课程、对照学习目标进行评估、使用评估结果做出改进。

关键词：高等教育评估;学生学习结果;评估框架

美国高校是学生学习结果评估的先行者。美国高校在开展评估的初期，公众一直怀疑评估是否会稍纵即逝。[1]但是，近二三十年的实践证明，评估不仅在高等教育领域得以继续，还获得了快速发展，不同的是评估的重点发生了变化。20世纪80年代中期，高等教育评估由关注教育投入转变到关注教育产出，学生学习结果评估因而受到广泛关注。90年代初期，美国三分之二以上的州都开展了学生学习结果评估。然而，由于州政府在评估中的作用逐渐削弱，认证开始走进公众视野。

认证是美国高校开展学生学习结果评估的主要推动力。它包括两种类型：区域认证和专业认证。区域认证是对高等院校整体质量的综合认证，认证机构是私人的非政府组织。[2]目前，同时获得美国高等教育认证委员会（Council for Higher Education Accreditation，CHEA）和美国教育部认可的区域认证机构有七所①，分别负责不同区域的高等教育认证。[3]专业认证是对高等院校某个专业进行的认证。有些高等院校除接受区域认证之外，还需接受专业认证。例如，工程和技术专业必须接受工程技术认证委员会（ABET）的认证，护理专业必须接受美国护理教育协会（CCNE）的认证，药学专业必须接受美国药学教育认证协会（ACPE）的认证等。

认证机构将学生学习纳入认证指标，要求高等教育机构收集关于学生学习结果的证据，但没有制定统一的评估框架，仅是强调由教师参与制定评估计划和开展评估实践。[4]通过已有的评估实践发现，评估框架主要包括四个方面：制定学习目标（what）、基于学习目标设置课程（where）、对照学习目标进行评估（how）、使用评估结果做出改进（so what）。虽然不是所有美国高校都采用此框架，但已经采用的高校证明它确实能够成为“基于证据”的学生学习结果评估的催化剂。

一、制定学习目标

制定学习目标是开展学生学习结果评估的第一步，即确定学生应该学习什么以及为什么学习这些内容。每个高等教育机构制定的学习目标并不相同，但应该考虑以下三个方面。

（一）学习目标与大学使命密切相关

当大学制定学习目标时，它应该嵌入在整个大学的规划和使命中，以此说明学生应该学习、实现和掌握什么。[5]大学使命能够反映整个大学的价值观和学生期望，不同层面的评估所制定的学习目标都与大学文化和使命密切相关。例如，印第安纳大学-普渡大学印第安纳波利斯联合分校（Indiana University-Purdue University Indianapolis）的使命是通过研究和创造活动、教学和学习以及公民参与，将印第安纳州和公民智力发展推向国内和国际的最高水平。通过提供一系列学士、硕士、博士学位和专业学位，通过创新合作、外部合作和多元化承诺促进印第安纳州中部及其他地区的教育、文化和经济发展。[6]通识教育的目的是以大学使命为基础建立起来的，目的是提供一套共同的课堂和课外经验，为促进学生在智力、性格、能力方面的发展奠定基础。由此，印第安纳波利斯联合分校确定了通识教育的六个领域：核心沟通和定量技能，批判性思维，智力的广度、深度和适应性，知识的整合和应用，社会和文化理解，价值观和道德规范。[7]基于这六个领域制定了学习目标。

（二）学习目标应是明确且可测量的

学习目标阐明学生期望学习什么以及能够学习什么，它应该是明确且可测量的，即从学习目标中可以看出通过哪些方法测量、什么时候测量以及谁来测量。如果没有满足这些标准，应该将最初制定的目标与学生沟通，及时做出修改。[8]通常来说，每个专业应该至少设定3个学习目标，具有代表性的专业应该设定5至12个学习目标。学习目标的表述应该从一个动词开始，能够证明学生的知识和能力。例如，“记忆和理解”“应用和分析”“评价和创造”等。

需要指出的是，不同层面（大学层面、专业层面、课程层面）所制定的学习目标虽然都与大学使命密切相关，但相比大学层面和专业层面的学习目标，课程层面的更为具体（见表1）。[9]琳达·苏斯基（Linda Suskie）曾指出，如果在一门讲授十九世纪诗歌的英语课程中，教师要求学生根据所学内容写下自己的看法，这个任务就是非常模糊的，缺乏重点，没有明确的目标。因為教师并没有说明评价标准，学生不知道教师想要什么，也不知道怎么做。这种情况还可能导致教师不知道如何评定学生成绩。实际上，教师可以考察学生的写作技巧，如语言组织、清晰度、语法和准确性，或考察学生对十九世纪诗歌的理解程度，或考察学生能否将十九世纪诗歌与其他文学和时代事件结合起来。[10]

（三）学习目标强调的两个主要类别

由于学习目标非常广泛，教师或管理者在制定学习目标时会感觉有些困难。制定学习目标框架，将其分为几个类别或许能够帮助他们解决困难。虽然高等教育机构没有制定学习目标的统一标准，但由于学习结果和学习目标密切相关，阿斯汀（Alexander W.Astin）关于学生学习结果的分类在某种程度上能够反映高等教育机构制定学习目标的一般标准。

阿斯汀将其分为两类：认知性和情感性。认知性包括专业知识、学术能力、批判性思维能力、基本学习技能、特殊能力和学术成就。这些内容与教育目标直接相关，是评估学生学习结果最常用的指标。它反映的是评估什么，倾向于学生的内部状态或特质，通常需要严格的控制条件和学生大量的时间。情感性包括价值观、兴趣、自我概念、态度、信念和满意度。它反映的是如何评估，通过自我管理问卷测量。[11]由于认知性内容与教育目标直接相关，有的学者指出目前大学所设定的学习目标更倾向于认知性。他们认为大学应该培养学生的智力，将评估重点放在认知能力上。实际上，通过几所大学所设定的学习目标发现，多数大学除强调学生的认知能力外，还关注学生的情感素质，如判断力、公民素质、社会责任和品格等。

二、基于学习目标设置课程

确定学习目标后，高等教育机构应该为学生提供“环境”来实现这些目标，而设置课程就是为学生学习提供的主要“环境”。由于教育环境的复杂性，高等教育机构面临如何将课程与学习目标连接的挑战。通常情况下，美国高等教育机构通过绘制课程地图来实现课程与学习目标的连接。根据美国国家学习结果评估研究所（National Institute for Learning Outcomes Assessment，NILOA）的调查②，70%的教务长表示他们正在绘制课程地图，但仅有50%的教务长表示他们已经完成。[12]

（一）什么是课程地图

课程地图（Curriculum Mapping）是运用系列课程或学习经验阐明、调整和整合学习目标，提供有效策略的方式。课程地图能够展现学生通过哪些具体课程获得相应的知识和技能，完成既定的学习目标。它通常采用网格的形式，学习目标在行，具体课程在列，并在能够满足学习目标的相应课程框内做出标记（如√），以突出哪个课程可以满足哪些学习目标（见表3）。通常情况下，一个课程至少会同时满足两个学习目标，关键课程会满足三个以上。[13]这意味着学习目标可能会在多个课程中体现，为学生选择课程提供多个机会。课程地图还可以帮助识别那些没有帮助和贡献的课程，如某个课程没有满足任何一个学习目标，可能意味着这门课程对学生学习的帮助很小，甚至没有帮助。课程地图说明了如何使用课程，也可以看成是专业改进的第一步。

由于学生学习是长期且持续的过程，课程地图的基本框架仅能反映出课堂中“课程”对其学习目标的反映。高等教育机构提供的学习“环境”不能仅局限于课堂中，还应包括课堂外的学习经验和活动。此外，还应考虑课堂外的学习经验和活动是否接受过评估？这些学习经验和活动何时能够满足学习目标？基于此，课程地图可以结合实际做出相应调整。

（二）如何绘制课程地图

绘制课程地图是最常见的将课程与学习目标连接的方法，绝大多数绘图活动由教师主导，通常不与学生讨论。因此，课程地图很少能够代表整体学生学习的经验。美国国家评估结果研究所建议在绘制之前应考虑几个问题：（1）是否已经存在既定的学习目标或学习框架？如果是，是否对既定的学习目标达成一致意见？（2）學习经验和活动与学习目标是否有关联？（3）是否对学习目标、教学大纲和教育活动做出调整？（4）课程地图能够回应哪些问题？需要获得哪些信息以改进学生学习？[14]

考虑以上问题后，高等教育机构可以通过三种方式绘制课程地图：其一，设定一个模板（template）发送给各部门的教师和行政人员，教师基于所讲授的课程填写模板，然后发送回去;其二，评估项目主任或系主任单独绘制所有课程地图，然后交给大学负责评估的部门。在绘制课程地图的整个过程中，他们很少甚至不会和教师讨论;其三，教师和行政人员共同讨论哪些学习经验与学习目标相关，评估是否能够检验学习经验和学习目标的一致性。[15]上述三种方式没有对错之分，都有优势和不足。前两种方式可以进行初步的课程评估，但这些课程地图实际上很少使用，也不会影响教育实践。此外，如果评估项目主任和系主任单独绘制课程地图，也无法保证统一性。第三种方式将不同利益群体聚集起来，共同探讨学习目标、学习经验和评估之间的一致性。这种方式的困难之处在于讨论需要时间和空间，还要考虑潜在利益群体的意愿。

三、对照学习目标进行评估

收集数据是保证学习目标、学习经验和评估一致性的重要途径。收集数据的方法既可以是直接的，又可以是间接的，两种方法都适用于学生学习结果评估的不同层面。

（一）直接评估

多数高等教育机构建议优先考虑直接评估的方法。同时也可以使用间接评估，但必须通过直接评估加以补充。直接评估方法主要包括：评价量表（Rubric）、顶点课程（Capstonecourse）、学生档案袋（Portfolio）、嵌入式课程评估（Embedded Course Assessment）、测验和考试（Tests and Examinations）等。其中，评价量表是教师最常用的直接评估方法。

评价量表是一套能够在不同水平上反映学生表现的质量标准。[16]严格来说，评价量表是描述性的，而不是评价性的。因为它不能直接获得评估证据，而是用来解释信息或转化证据的框架。这意味着评价量表作为一种评估工具，测量的是学生表现的程度，而不是学生应该如何表现。评价量表没有固定模式，以列表或图表的形式呈现，教师可以从几个维度设计评价量表（如：1=差，4=优秀），作为评价学生论文和口头演讲的具体标准。它通常由三部分组成：评价标准、每个评价标准的不同水平、评分等级（见表4）。

2009年，美国学院与大学协会（Association of American Colleges Universities）开发了一套评价量表——VALUE。④它从智力和实践技能（10个）、个人和社会责任（5个）、综合和应用学习（1个）三个维度设计了16个量表。[17]这些量表针对本科教育，主要目的不是用于评分，而是促进高等教育机构评估和讨论学生学习，并在全国范围内分享学生学习的证据。这些量表自发布以来已被美国乃至全球高等教育机构广泛应用。目前，美国超过2000家高等教育机构正在使用VALUE。美国学院和大学协会建议，高等教育机构应该在VALUE的基础上结合实际情况，开发自己的评价量表。[18]

评价量表具有几个明显优势：第一，减少评分时间。教师可以通过评价量表直接评估学生表现，而不是撰写长篇评论;第二，获得课堂反馈。教师可以认真思考他们正在教什么和学生需要学习什么;第三，减少成绩投诉。评价量表设定的评价标准非常具体，能够解释学生成绩的不同等级。第四，改进学生表现。评价量表可以向学生、家长和教师表明对学生表现的期望。[19]

（二）间接评估

间接评估主要以调查的方式呈现，通过几个特定的问题来了解学生在知识和能力水平上的变化。调查可以是定量的，如使用评级量表;也可以是定性的，回答開放式问题。常见的调查方法包括学生调查、校友调查和雇主调查。

1.学生调查（Student Survey）通过纸质和在线的方式获得学生对学习的看法。学生调查通常包括三个基本问题：A.教育经验在多大程度上对你有帮助？可以分为五个等级，即非常有帮助、有帮助、一般、不太有帮助、没有帮助;B.教育经验在哪些方面对你的学习有帮助？C.所学专业的哪些内容能够提高学习经验？

2.校友调查（Alumni Survey）通常询问与学习目标和学习结果相关的问题，目的是收集证据来改进课程。校友调查可以使用与学生调查相类似的问题。但需要注意的是，学生毕业的时间越长，收集的信息越不可靠。通常建议在毕业后的一年开展校友调查。[20]

3.雇主调查（Employer Survey）侧重了解毕业生的一般信息，如果雇主能够直接回应调查问题，这种方法非常有用。但实际上，雇主的回应往往是非常分散且模糊的。有效的方法是由雇主组成咨询委员会，召开年度会议讨论这些问题，或者进行焦点访谈（Focus Group Interview），由六到十个雇主组成团体来回应调查问题。

四、使用评估结果做出改进

无论是1993年哈钦斯（Pat Hutchings）提出的良好评估实践九项原则，还是2002年美国教育部报告发表的高等教育评估举措，都强调利用评估结果改进质量的重要性。[21][22]高等教育机构要实现改进就必须获得可靠的证据，以便了解学生知道什么和理解什么，并使用这些证据实现改进。

（一）获得可靠的证据

很多教师和管理者通常多次收集评估信息，以此确定学生学习的掌握程度。虽然有些高等教育机构的管理者建议优先使用直接测量的方法收集信息，但只使用这种方法收集的信息并不足够，有效评估应该结合直接测量和间接测量，允许教师比较多种测量的结果，提高评估的可信度。[23]

向不同利益相关者提供可信且有意义的学生学习证据是一项不小的挑战，特别是向区域认证和专业认证机构提供证据。教师教育专业（teacher education）就是必须回应专业认证和州级要求的例子。多数专业认证机构都希望教师能够持续不断地评估学生表现，同时能够证明学生在获得学位前可以具备所需的知识和技能。[24]

当教师评估学生表现时，需要考虑两个因素。其一，有效性（Validity）。检验有效性以确定证据能够支持和解释评估结果的程度。有效的方法可以直接和准确地评估专业层面和课程层面的学生学习。其二，可靠性（Reliability）。可靠性能够回应学生表现的一致性和稳定性问题。随着教师越来越依赖量表评价学生表现，不同教师之间很难保持对学生作业评价的一致性。有效性和可靠性对于提供可靠的学生学习证据非常重要。尽管在选择和实施方法之前已经考虑很多因素，但需要定期重新思考这些因素以确定所选方法是否能够实现改进。[25]

（二）实现改进的功能

通过分析近二十年相关文献发现，越来越多的教师和管理者在阐述评估目的时，更倾向将改进置于首位。这表明随着高等教育评估运动的发展和大学评估活动的开展，相对于评估的问责功能，教师和管理者在理论分析和实践探索中越来越强调其改进的作用。

但实际上，高等教育机构花费几年时间去制定评估计划、收集评估数据和完成评估报告，却没有进一步考虑如何改进学生学习的情况十分普遍。[26]这是因为评估信息和数据主要用来满足认证要求，侧重了解学生的学习结果，在改进学生学习方面非常有限。这意味着评估本身不具备改进功能，需要教师和管理者去促进改进。这需要几个条件：第一，讨论和解释评估信息。高等教育机构应该组织不同利益群体对所收集的信息进行仔细的讨论和解释，以便了解学生知道什么和理解什么。无论是纸质报告还是在线报告，多位专家提供的评估指导会更有帮助。[27]第二，重视教师参与的作用。教师是通识教育评估中最重要的利益群体，因为他们最了解学生，与学生学习密切相关。[28]如果教师能够积极、持续地参与评估，对改进学生学习非常有帮助。美国国家学习结果评估研究所（National Institute for Learning Outcomes Assessment，NILOA）2009年的全国调查报告显示，三分之二的高等教育机构表示他们需要更多教师参与评估。[29]第三，强调评估结果的使用。正如沃尔弗德（Barbara E.Walvoord）所指出，评估结果不仅说明高等教育机构采取了哪些方法来评估学生的学习情况，还应说明为学生学习而做出的改进。这种改进不仅针对学生学习，还为之后高等教育机构制定政策和做出决策提供依据。[30]

五、结语

尽管美国高等教育认证机构没有制定统一的评估框架，但高等教育区域认证机构之一中北部院校协会（Higher Learning Commission，HLC）的调查显示，几乎所有接受区域认证的高等教育机构都制定了评估计划和开展了评估活动。中北部院校协会将他们由低到高分为三个等级。第一等级：大学虽然实施了评估计划，但不能提供通识教育评估、专业评估和课程评估的证据;第二等级：大学已经实施评估计划，并有一定的证据表明大学将评估和改进学生学习放在优先发展的事项;第三等级：大学充分实施了评估计划，并有证据表明大学将评估和改进学生学习放在重要位置。这类大学的教师能够积极参与专业评估和课程评估，关注学生学习成绩的变化，改进学生学习。中北部院校协会认为，判断高等教育机构能够有效进行评估应该达到第三等级。[31]需要强调的是，无论高等教育机构处于哪一等级，通过评估来改进学生学习不应是偶然的，而应是持续的。

注释：

①美国的区域高等教育认证机构共有八所。其中，美国中部院校联盟（MSA-CESS）仅获得美国教育部的认可，没有获得CHEA的认可。其余七所均获得两个机构的认可。

②2009年和2013年，NILOA在线调查了已经获得区域认证并授予本科学位的两年制和四年制美国公立、私立和营利性大学，分别获得1518所和1202所美国高等教育机构教务长和学术负责人关于学生学习结果评估所做出的回应。

③威斯康星大学麦迪逊分校人类学系考古专业的评估计划是笔者在美国大学实地调查中所获得的研究资料。

④VALUE（Valid Assessment of Learning in Undergraduate Education）作为通识教育与美国承诺（Liberal Education and Americans Promise，LEAP）计划的一部分，是由美国学院和大学协会领导，与高等教育机构的教师和专家合作，针对16个基本学习结果制定了评价量表。VALUE用于帮助高等教育机构证明、分享和评估学生的成就，从而逐步提高他们的综合能力。

参考文献：

[1]BANTA T W.Building a Scholarship of Assessment[M].San Francisco：Jossey-Bass，2002：22.

[2]Council for Higher Education Accreditation.Accreditation & Recognition[EB/OL].[2020-02-02].https：//www.chea.org/about-accreditation.

[3]Council for Higher Education Accreditation.Regional Accrediting Organizations[EB/OL].[2020-02-02].https：//www.chea.org/search-accreditors-results-table？search_api_fulltext=&field_accreditor_type=1004.

[4][18]KUH G D，IKENBERRY S O.Using Evidence of Student Learning to Improve Higher Education[M].San Francisco：Jossey-Bass，2015：149，37.

[5][8][20][22][31]HERNON P，DUGAN R E.Outcomes Assessment in Higher Education：Views and Perspectives[M].Westport：Libraries Unlimited，2004：81-82，82，160，79，33.

[6]Indiana University-Purdue University Indianapolis.IUPUI Mission[EB/OL].[2019-08-27].https：//www.iupui.edu/about/vision-mission.html.

[7]BRESCIANI M J.Assessing Student Learning in General Education：Good Practice Case Studies[M].Bolton：Anker，2007：79.

[9][26][27][30]SECOLSKY C，DENISON D B.Handbook on Measurement，Assessment，and Evaluation in Higher Education[M].New York：Routledge，2012：34，602，604，604.

[10][13]SUSKIE L.Assessing Student Learning：A Common Sense Guide[M].2nd ed.San Francisco：Jossey-Bass，2009：115-116，99-101.

[11]ASTIN A W.Assessment for Excellence：The Philosophy and Practice of Assessment and Evaluation in Higher Education[M].New York：Macmillan，1991：43-44.

[12][14][15]National Institute for Learning Outcomes Assessment.Mapping Learning[EB/OL].[2019-08-20].https：//www.learningoutcomesassessment.org/ourwork/curriculum-mapping/.

[16]BROOKHART S M.How to Create and Use Rubrics for Formative Assessment and Grading[M].Alexandria：ASCE，2013：4.

[17]Value Rubrics.Association of American Colleges&Universities[EB/OL].[2017-03-06].https：//www.aacu.org/value-rubrics.

[19]TENAMZEMACH M，FLYNN J E.Rubric Nation：Critical Inquiries on the Impact of Rubric in Education[M].Charlotte：Information Age Publishing，2015：120.

[21]HUTCHINGS P.Principles of Good Practice for Assessing Student Learning[J].Assessment Update，1993，5（1）：6-7.

[23][24][25]BANTA T W，PALOMBA C A.Assessment Essentials：Planning，Implementing，and Improving Assessment in Higher Education[M].2nd ed.San Francisco：Jossey-Bass，2015：31，31-32，32-33.

[28]MORSE J A，SANTIAGO G J.Accreditation and Faculty Working Together[J].Academe，2000，86（1）：30-34.

[29]TAGG J.Why Does the Faculty Resist Change？[J].Change：The Magazine of Higher Learning[J].2012，44（1）：6-15.

（責任编辑赖佳）

收稿日期：2020-06-04

作者简介：谢晓宇，东北师范大学教育学部副教授，教育学博士。（长春/130024）

*本文系教育部人文社会科学青年基金项目“研究型大学学生学习结果评估国际比较研究”（项目批准号19YJC880103）的研究成果。

高教探索2021年2期

高教探索的其它文章: 我国职业教育产教融合制度体系构建的若干思考; 英国质量改进导向的院校评估理念与实践：以苏格兰为例; 转型中美国创业型大学趋同性特征与策略选择; 大学生认同理论在美国高校学生事务中的应用：演变、影响及启示; 为公众写作：大学教师不应忽视的社会责任; 扩招20年中国高校毕业生就业测量与就业变化