计算机组成原理教研论文主题比较分析

2022-07-14 12:56刘德喜廖国琼万常选狄国强
软件导刊 2022年7期
关键词:时间段职称教学研究

刘德喜,邹 婷,廖国琼,万常选,狄国强

(江西财经大学信息管理学院,江西南昌 330032)

0 引言

国家对计算机人才的培养高度重视,为满足社会对计算机人才的需求,计算机教育改革也在不断深入。不同层次的学校,由于人才培养定位不同,所选择的教学内容和教学方法存在较大差异,通过分析可帮助教师在教学中做到有教无类,因“材”施教。计算机教学研究文献是计算机教育工作者对教育教学研究成果的总结,包含了教育教学的模式、方法、经验、改革、创新等内容。通过分析、总结这些成果,不仅可供其他教师参考与借鉴,还可发现计算机教学的现状和规律,促进教学改革。

本文以《计算机教育》期刊2010-2019 年与计算机组成原理相关教研论文(简称教研论文)为研究对象,以自然语言处理领域的主题模型为主要方法,分别从第一作者的职称、学校类型及论文发表时间三个角度对论文的正文主题进行分析比较。尽管关于计算机组成原理的教研论文也分布在《软件导刊》《计算机应用系统》《中国大学教学》及一些学院学报上,但在《计算机教育》上相对集中,且层次覆盖丰富,分析结果具有较好的代表性和权威性。此外,本文采用的分析方法易于扩展到其它课程、课程群或其它专业文献集合上。

本文创新点包括利用主题分析方法对计算机组成原理相关教研论文进行分析;采用交叉混合主题模型,在主题分析过程中进行主题比较。

1 研究现状

前期调研发现,对计算机教学领域的期刊文献进行文献分析的案例十分少见。非计算机领域的学者在文献分析上通常采用元数据分析法或借助可视化分析软件,而计算机领域的学者则更多采用了相对先进的主题分析模型。

1.1 文献分析比较

刘娇等分析了2011-2020 年间重要教育理论期刊文献,通过分析总结教育现代化已有的研究内容和成果,反思了研究中存在的一些问题。黄崑等以内容分析法为主要手段,对近5 年图情SSCI 期刊上关于人工智能伦理研究的文献进行分析,得出了人工智能伦理问题的整体关注度与人工智能伦理研究领域具有较高一致性的结论。李建荣等使用CiteSpace 软件对思想政治教育文献的主题进行可视化分析。

目前,关于计算机教学领域的文献分析工作相对较少。宋珊珊利用知识图谱可视化分析软件CiteSpace 和文献计量学软件Bicomb,从文献的发表时间、作者、机构等角度对我国中职计算机教育教学研究相关期刊文献进行可视化分析。并且基于可视化分析结果,对中职计算机教育教学研究趋势进行预测,从而提出教学建议,但仍存在以下3 点问题:①对中职计算机教育教学文献的研究无法反映高校的实际情况,分析对象有待扩展;②现有工作并未对文献的正文内容进行挖掘,仅利用文献的元数据,如作者、期刊来源、作者单位等,研究内容有待丰富;③相关研究工作较少利用自然语言处理领域的最新研究成果,分析模型有待提升。

1.2 文献分析比较模型

非计算机专业的学者分析文献大多采用传统的元数据分析法、词汇统计法或借助一些集成的分析软件。事实上,在计算机领域,文献分析已有了相对成熟的模型。例如LDA 主题模型。

近两年利用LDA 主题模型进行文献分析的工作,主要还是集中在对科研论文的分析上。谭春辉等使用LDA模型对数据挖掘领域研究热点进行主题识别。岳丽欣等将LDA 模型结合多维尺度分析(Multidimensional Scaling,MDS)等主题分析方法。曹树金等将LDA 模型结合共词分析法,分析论文研究主题的演变,本质上也是直接使用LDA 模型进行主题识别,然后对主题识别结果运用Ucinet和Netdraw 软件进行共词分析。

以上方法均先采用传统LDA 模型进行主题识别,再对识别结果从多个维度进行分析。然而,传统LDA 模型忽略了词序问题,存在缺失上下文信息的不足,无法对文献主题进行比较分析。为此,有学者提出了改进的主题模型,例如Wallach提出的BTM(Bigram Topic Model,BTM),Tang 等提出的mLDA(multiple-contexts LDA,mLDA)模型及常东亚提出的基于滑动窗口的主题模型和基于中心词的上下文主题模型。这些模型都通过结合上下文信息,使提取出的主题更具体,能反映所在文档子集之间的差异。然而,这些较先进的主题模型大都用于新闻、微博等领域,很少被应用于文献分析,更没有被用于对教学研究文献进行分析比较。

2 数据准备

2.1 数据采集

用于分析的文献来自《计算机教育》期刊,时间跨度为2010-2019 年,主题为计算机类本科专业计算机组成原理课程教学研究。具体地,在知网上查询“篇名”中含有“计算机系统”“计算机组成”“计算机组织”或“计算机体系”的论文,然后排除相关性不大或非中文论文,共得到104 篇论文作为研究对象。

2.2 预处理

首先提取论文中的元信息,包括标题、发表时间、作者、作者职称、研究领域、工作单位、摘要、关键字、正文等内容。同时,构建用户自定义词典,使用结巴分词工具进行文本分词,并去除停用词。

按照本文对文献分析比较所设定的角度,对每篇论文设定以下3 类属性:①第一作者的职称分为教授、副教授、讲师、其它,其中“其他”包括助教、工程师和职称缺失的情况,仅选择第一作者,是为了更多地体现了第一作者的工作,此外合作者职称类别多可能会导致不同职称的作者所关注的主题趋同;②第一作者单位分为985 工程院校、211工程院校、普通院校;③为了既能反映变化规律,又不会因为个别年份论文数量过少而影响主题比较分析,按两年为一个时间段划分论文发表时间段,分别为2010-2011、2012-2013、2014-2015、2016-2017、2018-2019年。

2.3 数据分布

2.3.1 主题词云

文献的主题词云显示,计算机组成原理教学研究论文中,被谈论较多的词为课程、实验、学生、设计、教学、系统、实现等,涉及到课程内容、教学模式、实验教学等主题,其中实验教学主题被谈及的次数较多。

2.3.2 论文数量分布

图1 为不同职称、学校、时间段的论文数量分布。在论文作者的职称方面,第一作者职称为副教授的论文最多,共44 篇,占42%;其次是讲师和教授;其它职称作者的论文数量最少,仅占10%,这也符合高校中各职称类别的教师人数分布。

Fig.1 Distribution of papers图1 论文分布情况

在论文作者所在高校的类别方面,211 工程院校的教学研究论文数量最少,只有11 篇,占10%。这一方面体现了211 工程院校在教学上的定位,另一方面也提醒读者,由于样本数量的原因,本文对来自211 工程院校的论文主题分析的结论可能存在偏差。

在论文发表时间段方面,从2010 年开始,关于计算机组成原理方面的教学研究论文数量逐年递减,直到2018至2019 年,论文数量开始大幅度提升,体现了硬件类课程被关注的趋势,同时也反映了硬件类课程受国内、国际形势的影响。例如,2017 年开始的中兴芯片被断供事件激发了高校计算机教育界对硬件类课程的重视。

2.3.3 不同学校类型及作者职称的论文数量分布

图2为对比985工程院校和普通院校论文发布情况。

Fig.2 Paper numbers of different author titles and school types图2 论文数量关于作者职称和学校类型的分布

其中,副教授为教学研究的主体,论文发表数量占比最高,而在985 工程院校中讲师发表的论文较少,教授发表的论文相对较多,这与普通院校相反。可能由于在重点院校中,高职称教师在培养学生和教学方面投入了较多精力,而普通院选的教学任务则更多由副教授和讲师共同承担,这与各高校对教师的定位存在密切关系。

2.3.4 不同学校类型及发表时间段的论文数量分布

图3 为不同时间段中不同类型院校发表教研论文的分布情况。

Fig.3 Paper numbers of different school types and publication times图3 论文数量关于学校类型和发表时间段的分布

总体而言,各类型院校在不同时间段上发表教学研究论文的数量与论文总数量的变化趋势一致。在每个时间段,985 工程院校和普通院校的论文数量较多,其中普通院校最多,占比超过50%以上,211 工程院校的论文不超过5篇,甚至在2016-2017 年的数据集中未检索到211 工程学校发表的论文。原因可能为985 工程院校更重视本科生的培养,普通院校大多为教学型大学,教师在教学方面投入的时间精力更多,而211 工程院校则需要教学和科研并重,但对教师的考评方式仍然以科研为主,使教师在教学研究上的投入相对较少。

2.3.5 不同作者职称及发表时间段的论文数量分布

图4 为不同时间段中不同职称的作者发表教研论文的分布情况。总体而言,各职称教师在不同时间段上发表的教学研究论文数量与论文总数量的变化趋势一致,也与各职称的教师发表的论文总数量占比一致。

Fig.4 Paper numbers of different author titles and publication times图4 论文数量关于作者职称和发表时间段的分布

3 文献分析比较方法

3.1 LDA主题模型

主题模型是基于词项共现的概率统计模型,其基本思想是一篇文档可包含多个主题,文档中每一个词项都是由主题分布所生成。LDA 模型是由文档、主题和词项三层构成,通过LDA 模型从给定数据集中,学习到各文档的主题分布及各个主题的词项分布。

3.2 交叉混合主题模型

由于LDA 主题模型是在整个数据集的基础上,生成各文档的主题分布和主题中的词分布,并未在模型学习过程中考虑不同类别文档间的主题差异,无法对不同类别文档的主题进行比较。为了解决该问题,本文使用交叉混合主题模型对主题类别进行细分,挖掘它们所共有的背景、公共主题及各文本子集独有的特殊主题。

具体而言,背景主题是对整个文本集合的笼统归纳,例如本文使用的研究论文集合,它们的背景主题包括教育教学、组成原理课程及其它涉及公共用词方面的内容;公共主题是从全体文本子集中抽取出的共同主题,例如教学方法、授课内容、教学改革、实验教学等;特殊主题则与各文本子集相对应,例如教授的教研论文关注点为翻转课堂的教学方法,而讲师则关注线上教学的教学方法。使用交叉混合主题分析方法提取的主题具有层次性,可给分析者提供更多信息,便于从多角度分析不同文本子集关注的共同点与不同点。

交叉混合主题模型有三个关键参数,分别为主题数目

K

、背景主题权重

λ

和公共主题权重

λ

。其中,

K

为研究者指定提取出的公共主题个数,

λ

为词项被纳入为背景主题的概率,

λ

为词项被纳入公共主题的概率。本文中

K

以公共主题间的相似度和模型收敛速度为依据进行选择,

λ

以论文长度为参考进行设定,

λ

以公共主题和特殊主题间的语义一致性为依据进行设定。通过多次实验评估分析,本文设定

K

=3、

λ

=0.9、

λ

=0.2。

4 文献分析比较

4.1 不同职称关注主题的差异

根据第一作者的职称将104 篇文献分为教授(23 篇)、副教授(44 篇)、讲师(27 篇)和其它(10 篇),具体数据见表1。由于主题分析仅会得出文档(子)集中各主题的词项分布,因此根据这些词项分布,为其设定了不同的名称(见表1 加粗部分)。表1 中仅列出了相应主题中概率最高的前10 个词项,由于其它类别主要为助教和工程师,职称类别相对复杂且论文数量偏少,故本文暂且不进行深入分析。

Table 1 Topics concerned by different author titles表1 不同职称关注的主题

由表1 可见,不同职称的教师所发表的教学研究论文,可在硬件与实验、理论教学内容、教学方法与人才培养三个方面进行比较。

(1)硬件与实验方面。教授关注的是宏观系统级实验,重点培养学生的系统编程能力和整个系统性能,因此“系统、程序员、编程、性能、关联”等词汇较多;副教授关注仿真和验证类实验,偏向于理论与实践结合,因此“实验、信号、仿真、实验方式、理解、验证实验”等词汇较多;讲师则更关注具体部件级实验,因此“多核、核技术、浮点数、尾数、计数器”等词汇较多。

(2)理论教学内容方面。教授注重专业知识体系的形成,谈及较多的词项例如“诺依曼、指针、数据结构、对象”等,这些词项常常涉及其它课程;副教授重点关注课程内容本身,谈及较多的词项例如“中断、寄存器、寻址、补码、操作码、变址、堆栈、操作、累加器、指令”等,大多为计算机组成原理课程的内容;讲师较为关注考试和考研,因此“考研、真题、知识点、考查”等词项涉及较多。

(3)教学方法和人才培养方面。教授关注更多的是以学生为主导或教师学生双主体的教学模式,强调培养学生的动手能力;副教授则注重培养学生的计算机思维和系统能力;讲师关注并不具体。

对表1 的分析结果可知,不同职称的教师在硬件与实验、理论教学内容、教学方法、人才培养等方面的关注点存在明显不同,这与教学经历及对课程的理解有着密切关系。因此,对不同职称关注主题的差异分析,有利于教师快速把握提升教学质量的方向。例如,在硬件与实验方面,从部件级转变为系统级;在理论教学内容方面,从知识点(考点)转变为课程全局再到专业知识体系;在教学方法和人才培养方面,从基于评估和认证转变为以学生为本。

4.2 不同学校类型关注的主题差异

根据第一作者的单位将104 篇文献分为985 工程院校(31 篇)、211 工程院校(共11 篇)和普通院校(62 篇),具体数据见表2。

由表2 可见,不同学校类型所发表的教学研究论文,可在课堂教学、教学内容、实验内容三个方面进行比较。

(1)课堂教学方面。985 工程院校更关注教材的设计与选择,对教材讨论较多;211 工程院校的教师在关注具体课程知识点的同时,也关注课程的考核和教学方法;普通院校的教师则重点关注具体课程知识点的教学。此外,相较于普通院校,211 工程院校更关注计算机组成原理课程中多核、核技术、并行计算等内容。

(2)教学内容组织方面。985 工程院校强调实践教学,主张将课程理论与学生实践相结合;211 工程院校和普通院校都更偏重理论教学,但211 工程院校授课知识点偏宏观、系统,授课内容强调知识的连贯性与系统性,因此“编程、程序、程序员、系统结构、异常、优化”等词项较多。而普通学校则更多关注课程知识点的细节,因此“迁移、思维、抽象、中断、浮点数、计算思维、尾数”等词项较多。

Table 2 Topics concerned by different school types表2 不同学校类型关注的主题

(3)实验内容方面。985 工程院校侧重于讨论多部件集成实验,因此“微指令、机器码、模块、分布、数据通路”等词项较多;211 工程院校侧重于单部件实验,因此“寄存器、接口、计数器、单周期”等词项较多;普通学校对实验内容的讨论则较为抽象,因此“实验教学、能力、部件、过程、项目、实验方式”等词项较多。

对表2 的分析结果可知,学校定位、教学条件、师资、学生素质等诸多方面的差异对计算机组成原理教学影响较大。通过分析可为改进或改革教学提供较为明确的方向。例如,在课堂教学方面,普通院校可通过布置课外阅读等方式让学生关注“多核、并行”等内容;在教学内容方面,应更加重视实践、重视知识的系统性等;在实验内容方面,应从无实验到虚拟实验过渡,从单部件实验到多部件集成实验发展。

4.3 不同时间段关注的主题差异

根据论文发表时间,以2 年为时间段将104 篇文献分为2010-2011 年(30 篇)、2012-2013 年(20 篇)、2014-2015年(19 篇)、2016-2017 年(19 篇)、2018-2019 年(24 篇)。由于部分时间段的主题内容与相邻时间段差别不大,因此本文只列出主题内容发生变化较大的几个时间段,如表3所示。

Table 1 Topics concerned by different times表3 不同时间段关注的主题

由表3 可见,不同时间段所发表的教学研究论文,可在实验教学、理论教学、教学方法与教学模式三个方面进行比较。

(1)实验教学方面。2012 年前教师们强调撰写实验报告,例如:“实验报告、预习、文档、大纲、任务”等;2012 年后开始谈论具体部件的验证性实验,例如:“指令、寄存器、寻址、累加器、单元”等;2018 年后实验内容以虚拟仿真、真实硬件等实验内容为主,例如“方案、模拟器、虚拟仿真、验证实验、运算器、汇编器”等。

(2)理论教学方面。2015 年之前,教研论文仍以组成原理的章节内容为主;2016 年后则涉及数据结构、操作系统等其他课程知识;2018 年后,教师开始强调培养学生的计算机系统能力。

(2)教学方法与教学模式方面。2010 年左右以关注高等教育、成人教育中的教学方法及培养模式为主;2016 年开始关注课程群和课程体系的教学方法;2018 年则重点关注培养面向系统的能力和新工科教学方法。

对表2 的分析结果可知,各院校对计算机硬件实验的重视程度显著提高,开始从理论到实践、从模拟到真实、从单一部件到整机系统的方向发展,理论教学和教学方法上也越来越重视培养学生的系统观和系统能力。这种转变与我国信息技术发展紧密联系,与我国IT 业面对的恶劣国际形势相关。因此,培养学生的硬件和系统能力是计算机组成原理教学的基本要求。

5 结语

本文以《计算机教育》期刊上近10 年关于计算机组成原理的教学研究论文为对象,利用交叉混合主题模型,分别从教师职称、学校类型、时间三个不同维度进行分析比较。研究发现,这些论文都涉及理论教学、实验教学、教学方法与人才培养等主题,但不同职称、不同学校类型、不同时间段教师们的关注点存在差异,这些差异的根源来自于学校定位、教学条件、师资水平、学生素质、学科发展,甚至国际形势。借鉴主题分析结果,教师可根据学校人才培养定位、生源质量和教师目前的认知阶段,在教学内容、教学模式和教学方法选择中做到有教无类,因“材”施教。同时,在了解教学研究发展趋势的基础上,设计具有针对性的改进方法。

尽管本文所采用的方法也适用于其它课程、课程群或其它专业的教学文献,但目前仍存在以下4 点不足亟待改进:①主题分析方法仅能分析较为“抽象”的主题,提炼的主题具有一定的主观性;②部分子集合中论文数量过少,主题分析的有效性存疑;③目前分析的角度仅为作者的职称、学校类型和时间段,内容仍有待丰富;④受作者认知局限性,对主题分析结果的解释存在一定的主观性。

猜你喜欢
时间段职称教学研究
夏天晒太阳防病要注意时间段
高中数学教学研究
发朋友圈没人看是一种怎样的体验
申请科研项目,不应以职称论高下
交替传译中听记平衡教学研究
不同时间段颅骨修补对脑血流动力学变化的影响
职称
职称评审实现了“两大转变”
不同时间段服用左旋氨氯地平治疗老年非杓型高血压患者31例
语文课堂有效教学研究