基于内容分析的教育测量与评价课程国内外教材对比研究

2024-04-09 18:02张继威张兆远
高教学刊 2024年10期
关键词:内容分析对比研究全球化

张继威 张兆远

摘  要:随着教育全球化的深入推进各国之间的教育合作与交流变得愈加紧密,此过程中各国互取所长、相辅相成。特别是教材的交流与学习成为教育领域合作的一个重要环节。中国不少出版社积极引进、翻译众多国外的精品教材为国内教师、学者和学生提供宝贵的教学资源。选择合适的教材对于提高课程质量至关重要。该文将围绕“教育测量与评价”这个主题,对比分析国内外的经典教材,旨在探寻教材之间的差异和相似之处,以期为教师提供综合应用的参考,同时也为未来编写更具创新性的教材奠定基础。最后,该文的研究方法也可以为其他学科的教材研究提供借鉴。

关键词:教育测量与评价;教材;内容分析;对比研究;全球化

中图分类号:G423        文献标志码:A          文章编号:2096-000X(2024)10-0006-05

Abstract: With the deepening advancement of educational globalization, cooperation and exchanges between countries in the field of education have become increasingly close, benefiting from mutual learning and complementing each other. In particular, the exchange and study of textbooks have become a crucial aspect of educational collaboration. Many Chinese publishers have proactively introduced and translated numerous high-quality foreign textbooks, offering valuable educational resources for domestic teachers, scholars, and students. The selection of appropriate textbooks is paramount to enhancing course quality. This paper focuses on the theme of "educational measurement and evaluation", and conducts a comparative analysis of classic textbooks from both domestic and international sources. The aim is to discern the differences and similarities between these materials, offering comprehensive references for educators and laying a foundation for the creation of more innovative textbooks in the future. Furthermore, the research methodology employed in this article can also serve as a reference for textbook research in other disciplines.

Keywords: educational measurement and assessment; textbooks; content analysis; comparative study; globalization

在当今这个数字化深入渗透到每一处角落的互联网时代,教育与数字化和全球化紧密融合正在经历一场前所未有的变革。从技术维度来审视,线上课程与MOOCs(大规模开放在线课程)的出现以及虚拟课堂、远程学习的普及,均为教育技术的全球化共享与交流提供了坚实的技术支撑。而人工智能在教育领域中的广泛应用则进一步推动了教育方法和手段的创新。同时,各国之间教学合作项目的快速增长,留学生人数的稳步上升,以及学历和学位的国际互认都极大地促进了全球教育资源和人才的流动。这些因素共同推进了教育领域全球化的深入发展,预示着一个跨文化、高效和多元的未来教育格局。

正是在这样的大背景下,教材作为教育的重要组成部分,其内容、结构和教学理念也随之发生变革。教育测量与评价作为教育领域的核心课程,相关教材在外国的表现和特色如何。基于此本文针对国内外的优秀教材进行深入的对比研究,期望能揭示不同文化和教育背景下的教材特色和创新点,以及在全球化背景下各国如何处理教育评价这一核心议题。这样的对比分析不仅有助于完善和丰富现有教材的内容和形式,更为教师提供了一种跨文化的视角,助力其在全球化的大背景下作出更加合理的教学和研究决策。此外,随着教育领域全球化的深入发展,教材的内容、结构和教学理念的对比和研究不仅具有理论意义,更在实践中有着广泛的应用价值。教材研究和改进将成为跨文化、高效和多元的未来教育格局的重要基石。

一  挑战与机遇

(一)  挑战

1  背景差异

現代社会随着全球化国际化日益深入,彼此间的了解也越来越广泛和深入,但是不同地域不同国家的文化和教育背景可能依然存在着显著差异。国内和国外的教育系统、教育哲学、教育观念、评价体系和价值观念等都可能有所不同,这些因素都可能会影响教材的内容和结构。

2  语言和翻译

翻译有时难以完美捕捉原作的深意,更不用说每位读者在阅读原著时都可能产生各自的解读。因此,即便翻译能够忠实于原文的内容,但文化、语境和教育背景的差异依然可能带来某些概念的解读偏差或误解。

3  技术的局限性

尽管机器学习和自然语言处理技术为内容分析提供了有力的辅助,但其依然存在局限性,例如可能无法充分领会文本的复杂性与深意。最终,真正的使用者和评估者还是人类。

4  评价指标的选择

确定哪些指标能够最为准确地揭示教材的质量和独特性无疑是一大挑战。面对同样的问题,不同的专家或许会因其学术背景和研究经验而有所偏好,导致他们在选择指标时的侧重点产生差异。这也意味着评价一本教材时单一的评价标准可能并不全面,需要综合多方意见才能更为深入地挖掘其内涵和价值。

(二)  机遇

1  全球化的视角

通过对比国内与国外的教材,我们不仅能够获得一个全球化的视角,更能借此一角洞察到各种文化和教育体系如何处理、解读和传授教育测量与评价这一关键主题。这种跨文化的对比分析将极大地丰富我们的认知,使我们能够多维度地去思考同一问题,并挖掘出不同教育传统和方法在实践中的独特价值和智慧。同时,这也为我们在教学或研究中采纳和融合不同的思想和方法提供了更加坚实的基础。

2  教育实践的创新

通过比较和分析我们不仅有可能发现新颖的教学方法、理论框架和实践策略,更重要的是可以从全球的丰富实践中汲取智慧和经验。将这些国际化的视角和策略引入到自己的教育体系中,不仅可以丰富教育的内涵还可以有效提升教育质量和效果。同时,这样的交流和对比也促进了教育者之间的相互學习和合作,进一步推动教育创新和进步。

3  技术的进步

随着机器学习和自然语言处理技术(Natural Language Processing,NLP)的迅猛发展,我们已经可以看到在内容分析领域的种种变革。这些尖端技术不仅为我们打开了新的研究视野,让我们得以更加深入、准确地挖掘和理解教材内容,而且在处理大规模数据时显示出前所未有的速度和效率。利用这些技术我们能够探索和发现教材中的隐含模式、关联和趋势,这些可能是传统方法难以觉察的。因此,机器学习和NLP技术不仅为教育研究带来了高效率,还为我们提供了更广泛、更深层次的认知视角。

4  促进国际合作

教材的对比研究不仅具有学术价值还有可能引起国际教育界的关注和兴趣。这为不同文化和背景的教育者提供了一个交流平台促进知识、技术和经验的共享。在这样的交流与碰撞中教育者们可以互相学习取长补短,从而共同推进教育测量与评价领域的繁荣与进步。此外,这种跨文化跨国界的合作还可能碰撞出思想的火花催生新的教育理念和方法为全球教育质量的提升夯实基础。

5  小结

总而言之,虽然基于内容分析的教育测量与评价国内外教材的对比研究面临一些挑战,但同时也带来了许多机遇,为我们提供了一个全球化的新颖的视角来看待“教育测量与评价”这一主题。

二  研究方法的创新

本文将传统内容分析与现代技术相结合进行研究,采用机器学习和NLP技术辅助内容分析。传统的内容分析主要依赖人工的方式来解读、分类和总结文本内容。随着科技的发展机器学习和NLP技术的不断进步,内容分析的方式和方法也得益于技术的进步得到了很大的拓展和深化。

(一)  传统内容分析的局限性

主观性强。传统内容分析很大程度上依赖研究者的经验和判断。同时,不同的研究者还会受到自身背景和偏好的影响。这些都有可能造成分析结果带有很强的主观性。

效率低。处理大量数据时人工分析非常耗时。通常一本教材几十万字的内容仔细阅读进行内容分析需要耗费大量时间才能完成,这无疑是低效率的。

结果一致性差。传统内容分析效率低,因此有时研究者可能会采取分工合作的方式来完成研究工作,而不同研究者的主观性又很可能得到前后意见不一致的分析结果。

(二)  现代技术的优势

高效性。可以快速分析大量的文本数据。这正好能够满足几十万字的教材内容分析的需要,极大地提高了工作效率。

客观性强。机器学习算法的决策是基于数据(包括文字、图像、语音和数字等)和预设模型的,这在很大程度上降低了主观偏见。

模式识别。能够识别教材中的复杂模式,如复杂度评估、可视化分析、比较分析、情感分析和主题建模等。

(三)  评价指标的意义

内容质量。准确性,即内容是否正确无误,没有明显的错误或遗漏;全面性,即内容是否涵盖了该领域的核心概念和关键知识点;深度,即内容是否深入,提供了足够的详细信息,以帮助学生深入理解;时效性,即内容是否是最新的,反映了领域的最新发展。

组织结构。逻辑性,即章节和内容的组织是否具有逻辑性,易于理解;连续性,即内容是否连贯,每一部分是否都有清晰的连接。

易读性和呈现方式。布局和设计,即页面设计是否清晰,图表、图片和文本是否协调;文字表述,即语言是否清晰、简洁,没有冗余;实例与案例,即是否提供了充分的实际例子来阐明概念。

互动和参与。活动和练习,即是否包含了有效的练习和活动,帮助学生实践和加深理解;反馈机制,即是否有为学生提供反馈的工具或资源,如答案解析。

文化和价值观。多样性,即内容是否反映了多种文化、背景和观点;中立性;内容是否公正、客观,避免了偏见和刻板印象。

教学支持。教学指导,即是否提供教师手册或指导资源,帮助教师更好地使用教材;资源和补充材料,即是否有在线资源、额外阅读材料、习题库等。

适用性。适用对象,即该教材是否适合其目标读者,例如初学者或进阶学者;灵活性,即教材是否能灵活适应不同的教学方式和环境。

价值。价格,即考虑到其内容和质量,该教材的价格是否合理;持久性,即教材是否能长时间使用,不会很快过时。

评价教材时,可以根据上述指标进行详细的分析,但也需要考虑到特定的教育背景和目标。

(四)  结合现代技术的方法

使用机器学习和NLP技术可以自动识别并评估上述评价指标。例如,通过情感分析可以判断内容的情感深度;通过主题建模可以判断内容的多元化;文本的复杂性和长度可以用来评估易读性等。结合传统内容分析与现代技术,不仅可以提高内容分析的效率还可以提高其准确性和一致性。这种结合为研究者提供了一个全新的、有效的工具来深入探索文本内容,并从中获得有价值的见解。总的来说,传统内容分析和现代技术的结合为研究者提供了一个更为全面、深入的工具,可以更好地评估和理解文本内容。

三  数据视角下的内容分析

(一)  可读性分析

选取4本英文《教育测量与评价》教材[1-4],采用Python中的textstat包对这4本教材进行分析,选取其中4个指标进行分析结果见表1。从表1中可知,文献[4]教材的Flesch阅读便利性指标值最大,说明它是这4本教材中最容易阅读的;文献[3]教材指标值最低,说明它是这4本教材中最难阅读的;文献[2]教材的文本标准指标值为12最低,最高值为14,从总体年级估计结果来看这些教材都适合大学生阅读学习;文献[4]教材的平均句子长度指标值为17.6最低,文献[3]教材的值为19.3最高,通常认为句子越长越难阅读这正好与Flesch阅读便利性指标值意义相反。

由于textstat包是针对英文的语言特点进行编写的,所以此处仅对选取的4本英文教材进行文本分析,文献[1]教材有对应的中文翻译版教材文献[5]。Python中的cntext包是一款中文文本分析工具,其中包含可读性分析,文献[5]教材的可读性得分为47.03,文献[6]教材的可读性得分为53.08,指标值越大文章复杂度越高可读性越差,这与textstat包中的Flesch阅读便利性指标值的意义相反。下面我们主要对翻译版文献[5]教材(2015)与中文文献[6]教材(2016)进行深入分析,它们年份相近且都是中文适合比较,文献[6]教材的第二版[7]已于2022年出版。

(二)  目录分析

对比分析文献[5]教材与文献[6]教材的目录发现,这两本教材都涵盖了教育测量和评价的重要内容,但也存在侧重和差异,对比分析如下所述。

1  章节数量和结构

两本教材的章节数量大致相似,文献[5]教材比文献[6]教材多两章,整体的章节结构和标题有所不同。例如,文献[5]教材前三章主要涵盖了教育评估简介、数学基础和测试得分的意义;而文献[6]教材的前三章主要涵盖了教育测量与评价的概论、历史和基础理论。这表明两本教材对相同主题的处理方式有所不同:文献[5]教材更注重基础知识和实践,并且在每章结尾提供推荐读物;文献[6]教材更注重把握理论发展和全局。

2  主题涵盖

两本教材都包括关于教育测量、评价的基本概念、理论和方法。然而,它们的涵盖范围略有不同。例如,文献[5]教材更加关注测验特性和测验设计,而文献[6]教材更强调教育评估的实际应用。

3  附录和参考文献

文献[6]教材提供了参考文献,文献[5]教材提供了更为丰富的内容包括参考文献、索引、练习题答案和附录A—G各类与教育测量有关的规范及标准。

综合来看,两本教材都提供了有关教育测量与评价领域的重要内容,但它们的重点和深度有所不同。教师可以根据具体的教学需求和研究兴趣进行选择。如果更關注某些特定的主题,可以选择涵盖这些主题更广泛或更深入的那本教材。比如文献[6]教材中特殊学习障碍的一个新的评估策略:干预反应(RTI),以及评估调整关于残疾学生的评估等。

(三)  内容摘要分析

使用NLP技术自动提取教材的关键内容为读者提供摘要,可以调用Python中的jieba包来实现,jieba包也是一个适合中文的文本分析工具。

第一组,文献[5]教材中的关键内容结合词频由高到低排序:测验,评估,试题,学生,得分,测量,教育,信度,教师,评分,效度,考生,解释,表现性,成就,标准,方法,论述题,量表,分数,提供,成绩,开发。

第二组,文献[6]教材中的关键内容结合词频由高到低排序:测验,测评,评价,测量,教育,教师,学生,受测者,信度,教学,学校,效度,难度,方法,发展,区分度,分析,课堂教学,结果,试题,测题,SPSS,内容。

通过对比两组关键内容,我们可以分析出两本教材的不同侧重点和特色,以下是基于两组关键内容的对比分析。

1  共同的核心主题

两组关键内容中都出现了“测验”、“评估”(第二组为“测评”)、“测量”、“教育”、“教师”、“学生”、“试题”、“信度”和“效度”等关键词。这些词语均与教育测量与评价的核心概念密切相关,说明两本教材都涵盖了该领域的基础概念。

2  侧重点的差异

第一组关键内容中出现了“得分”“评分”“使用”“考生”“表现性”和“成就”等,意味着文献[5]教材可能更侧重于考试评分、学生的成就表现、考生的特性。

第二组关键内容中出现了“教学”“学校”“难度”“SPSS”“课堂教学”和“项目”等,这些词汇意味着文献[6]教材可能更多地关注教育的实际应用、学校和课堂的评估、不同难度层次的题目设计,以及使用SPSS这类统计软件的数据分析。

3  数据分析与工具

第二组关键内容中特别提到了“SPSS”,这是一款常用的统计分析软件。这意味着文献[6]教材可能详细讨论了如何使用SPSS进行数据分析,可能更适合希望进行实际操作和数据分析的读者。

4  概念的深入探讨

第一组关键内容中的“解释”和第二组中的“分析”可能意味着两本教材都在一定程度上对关键概念进行了深入的探讨和解析。

5  实际应用与教学

第二组关键内容中的“课堂教学”“学校”和“教学”等词汇说明文献[6]教材可能更侧重于教育测量与评价在实际教学环境中的应用。

6  相似度分析

余弦相似度(Cosine Similarity)是一种在多维空间中评价两个向量方向一致性的度量方法,常用于文本分析中计算两段文本或两组数据的相似性。杰卡德相似度(Jaccard Similarity)是用来比较两个集合相似度的一种指标,它是两个集合交集大小与并集大小之间的比例,通常用于文本相似性比较、推荐系统、数据挖掘等应用场景。调用Python中的cntext包计算文献[5]教材与文献[6]教材的余弦相似度与杰卡德相似度分别为0.36与0.22。由相似度计算结果可知,虽然两本教材都在讲述教育测量与评价课程,但显然它们的风格和讲述方式存在明显差异。

综上所述,两本教材都涵盖了教育测量与评价的核心概念但各有侧重。文献[5]教材内容广泛、附录丰富实用性强更侧重于考试评分和学生的特性与表现,而文献[6]教材理论性强更关注教育全过程,包括学校发展、课堂教学、教师发展和学业成就的测量与评价。教师或学生在选择教材时可以根据自己的需求和兴趣进行选择。对数据进行可视化处理,绘制词云图能帮助我们更加直观清晰地理解和感受上述分析,如图1所示。

四  现代教材的发展趋势

数字化和个性化是现代教育的两大趋势,现代教材也应该适应这种趋势。首先,数字化教材更加便于个性化和自适应学习,能够根据学生的学习进度和需求进行调整。其次,互动性和多媒体元素越来越多,如嵌入的视频、动画和自动评分的练习,这些都增加了学习的吸引力和效率。此外,数字化教材具有出色的可扩展性和可访问性,使得远程学习和自主学习更为便捷。在这方面文献[6]教材提供的二维码关联了课程的教学录像、教学课件等数字化资源,学习者通过扫描二维码就可以观看相应的数字化资源。

综合来看,在数字化时代教育测量与评价课程的教材在数字化方面有着显著的优势,除了延续传统教材的评测理论和方法,还可以集成各种在线评测工具。充分利用在线资源如录制小视频、案例研究等,进一步丰富教学内容和形式,增强教材的互动性、实用性和灵活性更好地适应现代教育的需求和发展趋势。

五  总结与讨论

在教育事业的不断发展和变革中,教材作为教与学的关键载体其重要性不言而喻。本文针对教育测量与评价课程国内外教材的对比研究提供了传统内容分析结合机器学习和NPL技术的方法,期望有助于未来教材的改进和发展。

在全球化背景下教材的国际化趋势日益明显。通过国内外教材的对比分析,我们发现不同文化背景下对教育测量与评价有着不同的教学理念和方法。例如,西方教材更强调实证研究和案例分析,而国内教材则更侧重于理论框架和基础知识。因此,推进国际合作共同编写教材,不仅可以借鉴国外的优点,还可以整合各方的优势使教材更全面、更国际化。教育测量与评价本身是一个跨学科的领域,既有数学统计的严谨,也需要教育学和心理学的实用视角。因此,未来的教材应注重多学科的融合与创新,例如在传统的测评理论基础上加入大数据分析、人工智能等前沿科技,以拓宽学科边界和应用场景。依靠这些技术支撑教材不仅可以实现数字化更可以进行个性化推荐以实现更灵活、更个性化的教学,同时可以适应不同学生的学习需求和节奏,这是传统教材难以实现的。创新教材应将这种融合和创新体现出来以满足现代教育多样化和复杂化的需求。

综上所述,教育测量与评价作为现代教育体系中的核心部分[8],其教材的研究和发展具有重要意义。未来的教材应该是一个融合了多学科知识、国际视野、现代教育技术以及个性化教学需求等多角度的创新和改进的综合体。这样的教材更能适应快速发展的现代社会,满足不同学生群體的多样需求。本文的研究由于时间和资源的限制仍存在一定的局限性,例如样本范围较小,没有涵盖所有类型的教育测量与评价教材,缺乏长期实证研究等,期待在今后的研究中有机会与相关领域的学者共同探讨继续深入研究。

参考文献:

[1] REYNOLDS C R,LIVINGSTON R B, WILLSON V. Measurement and assessment in education[M].Upper Saddle River: Pearson Education International, 2010.

[2] SIVAKUMAR A,Thirumoorthy G. Measurement and evaluation in education[M].A.P.H.Publishing Corporation,2019.

[3] PAL K. Educationalmeasurement and evaluation[M]. Lovely Professional University, Phagwara.

[4] KUMAR H,ROUT S K ,DALABH M. Educational measurement and evaluation[M].Directorate of Distance Education, Tripura University, Vikas Publishing House Pvt. Ltd, 2013.

[5] REYNOLDS C R, LIVINGSTON R B, WILLSON V. 教育评估与测量[M].霍黎,霍舟,译.北京:科学出版社,2015.

[6] 朱德全,徐小容,李鹏.教育测量与评价[M].北京:高等教育出版社,2016:7.

[7] 朱德全,徐小容,李鹏.教育测量与评价[M].2版.北京:高等教育出版社,2022:9.

[8] RANDY E B.教育测量的未来趋势[J].教育测量与评价,2019(3):3-14,18.

猜你喜欢
内容分析对比研究全球化
新旧全球化
全球化减速:全球化已失去动力 精读
全球化陷阱
我国的MOOC平台学习支持服务现状研究
2016年《中国日报》“两会”数据新闻报道研究
从《远程教育》35年载文看远程教育研究趋势
诗歌里的低诉,苍凉中的守望
模因论视角下的英汉网络语言对比研究
汉藏数词对比
传统中药学与生药学的对比研究