张竞成 袁琳 陈丰农 吴开华
【摘 要】“模式识别”作为理工科院校研究生阶段一门重要的专业课,与科研过程联系紧密,其教學效果对研究生科研质量有较大影响。本研究首先介绍了“模式识别”课程的教学现状。在此基础上,对研究生“模式识别”课程与科研结合点进行剖析,分别从(1)数据分布、统计特征、概率密度特征,(2)各类分类器的原理及适用条件,以及(3)特征选择和提取方法三个方面进行介绍,并介绍了笔者所在的教研室对研究生“模式识别”课程进行的改革和探索。最后指出课程未来建设发展的问题和挑战,希望给广大同行提供参考。
【关键词】模式识别;研究生;教学方法;改革
中图分类号: TN911.7-4;G642 文献标识码: A文章编号: 2095-2457(2019)06-0200-002
DOI:10.19694/j.cnki.issn2095-2457.2019.06.077
0 引言
模式识别(Pattern Recognition)是通过计算机用数学方法来研究模式的自动处理和判读,该门课程由于在电子、自动化、通信、生物工程等多个理工科领域有广泛的应用,同时也与数据挖掘、大数据分析、人工智能等多门现代新兴学科有着广泛而深刻的联系,很多知识是这些学科领域开展研究工作的工具和基础。因此,模式识别作为一门研究生课程在高校的理工科相关专业中广泛开设。模式识别课程的内容与统计学,线性代数,离散数学等多门基础数学课程关联,同时如神经网络、遗传算法、模拟退火等多种模式识别和优化算法又借鉴了仿生学以及其它物理原理、规律和模型,因此教学内容较为复杂,教学难度较高,致使研究生对课程的掌握普遍停留在“大概了解”的水平,难以将课程知识和方法活学活用,促进科研工作。本文对研究生模式识别课程的教学现状进行梳理,并且结合教研室老师在研究生模式识别多年授课中进行的思考和尝试,探讨如何将研究生模式识别课程与科研更好地结合。
1 “模式识别”课程教学现状
模式识别课程由于涉及内容综合而广泛,因此教学方式往往灵活而多样。目前,国内部分高校等模式识别任课教师已尝试对课程教学方法进行不同形式的改革和实践。戚玉涛等(2010)针对学生数学基础有限的问题,结合教学实践,将模式识别的教学内容划分为基础型和前沿型两类,并针对两种类型提出弱化公式推导强调物理含义的教学思路,结合实例先导教学法从如何培养学生实践能力和科研兴趣的角度给出了一些建议[1]。刘雨等(2011)针对“模式识别”课程教学,提出了开放式案例教学的构想和具体实施方法,并以课程实验加课堂研讨的方式实现,从实际科研项目中分解提炼出与课程教学内容相关的内容作为案例,设计分层次、纵横连贯的课堂研讨教学[2]。张灿龙和唐艳平(2014)针对模式识别课程教学中存在的诸如课程难度较高、教学方法单一、学生数学基础较差等问题,提出了监督式任务驱动、开放式案例设计、虚拟教学平台建设等改革方案,并进行了有益的实践[3]。马丽和侯强(2014)在进行模式识别课程教学时,通过科学的教学设计培养学生的创新思维和科研能力,采用以实际科研任务为主线和以启发科学思维为核心的教学方法,培养学生独立分析问题、解决问题的能力[4]。孙丽慧和宋蔚(2016)尝试将模式识别课程与科研实际结合,结合心电图(ECG)信号处理方面的最新研究进展,探讨了对课程教学手段、教学方法及教学内容改进和完善的改革和实践[5]。陈锡爱等(2017)将项目教学方法应用于模式识别研究生课程的教学,以工程项目开发能力为培养目标,以视觉检测在生产线上的应用为实验对象,采用理论教学与实践教学交叉进行的方式,有效锻炼学生的系统设计和测试能力[6]。综上,如何将模式识别课程教学与科研实际相结合可能是改善课程教学效果,培养学生创新能力的可行途径。
2 研究生“模式识别”课程与科研结合点剖析
模式识别课程的不同章节能够为科研提供不同的思考角度、分析工具和解决问题的策略。本部分对这些联系进行一定的梳理,以便于课程教学中更好的选择教学方法,把握教学重点。
2.1 对数据分布、统计特征、概率密度特征的理解和分析
在很多的科研问题中都需要对数据的分布统计特征和概率密度特征有深入的了解,模式识别课程中关于统计决策方法以及概率密度函数估计两部分中相关的内容能支撑上述分析,使研究者更好地了解所分析数据的特征。具体的方法可以包括正态分布时的统计决策、最小错误率及最小风险贝叶斯决策、参数估计、最大似然估计、贝叶斯学习等。该部分的知识与概率统计课程中的内容关联紧密、相互补充,在教学过程中应注意对两门课程中关联内容的介绍和串讲。
2.2 理解各类分类器的原理及适用条件
分类器是模式识别课程的重要内容,同时也是各类科研中频繁用到的工具。分类器大体可以包括Fisher线性判别、感知器、支持向量机等线性分类器,二次判别、多层感知器、人工神经网络等非线性分类器,K-近邻法、决策树和随机森林等其它分类器以及K-MEANS聚类、ISODATA等非监督分类器。不同的分类器具有不同的原理和特点,因此也就有不同的适用条件。科研中经常遇到的一个问题是在什么条件下为解决什么问题应如何选择合适的分类器。教师在讲授该部分内容时应注意对不同分类器的原理和适用条件进行对比,并结合一些案例说明分类器选择的原则和思路。此外,近年来得到快速发展的深度学习等算法在科研中,受到越来越多多关注。这些新算法,通常从传统的模式识别算法,演变发展而来,例如深度学习算法是从人工神经网络发展而来。因此,授课过程中可以对这些新算法进行扩展介绍,讲述其特点以及在大数据处理和分析等方面的优势,使其更好地为科研所用。
2.3 掌握特征选择和提取方法
特征是模式识别过程中联系数据和模型的重要媒介,在科研问题的解决过程中具有重要意义。模式识别课程中给出了特征选择与提取的方法,包括各种类别可分离性判据,模拟退火、遗传算法、粒子群算法等特征组合优化算法,以及主成分分析、独立成分分析、偏最小二乘回归等特征提取算法。这些方法能够帮助研究者筛选出对问题敏感的特征,并将特征进行有机组合以提高建模的效率。近年来的一个新趋势是将特征选择和提取方法与分类器耦合,形成一个从数据到模型的整体分析框架,也称为Wrapper方法,在实际研究过程中相比于传统的Filter方法往往能够获得更理想的效果。该部分内容的讲授应注意结合研究生的专业背景,选择适当的研究案例,以更好地启发和引导学生灵活掌握和应用这些方法。
3 结合科研的研究生“模式识别”课程改革探索
笔者所在的教研室对研究生“模式识别”课程的改革探索主要包括三个方面:(1)首先,是在讲授过程中插入案例对方法进行讲授和解释。(2)根据研究生的专业方向选择了一个基于遥感光谱数据的植物分类和状态监测研究作为分析案例,介绍了ISODATA波段聚类和JM距离结合的特征敏感性分析方法,对比分析了K近邻算法、遗传算法-支持向量机耦合算法(GA-SVM),以及随机森林(RF)算法在建模过程中的性能和特点,据此对模式识别的整个流程进行演示和分析。(3)布置一项开放性作业,要求结合自己所从事的科研任务,采用相关模式识别方法进行分析、展示和报告。经多年教学改革实践,课堂讨论气氛热烈,学生普遍反映通过这种教学方式既掌握了模式识别相关方法并有更深入的理解,同时也有助于科研工作的开展。
4 问题与展望
“模式识别”作为众多理工科专业研究生阶段一门重要的工具课程,其教学效果深刻影响着研究生科研的质量。虽然笔者所在教研室以及国内外教师同行近年来在课程教学方面进行了一系列的改革,但仍存在一些问题和挑战,主要體现在(1)如何更有效地将课程内容与相关基础数理知识有机联系;(2)如何把握具体算法原理和应用两方面的教授重点;(3)如何更多地创新教学模式和方法,采用一些先进的教学工具提升教学效果。相信未来通过不断创新和努力能够逐步提高“模式识别”研究生课程的教学质量。
【参考文献】
[1]戚玉涛,刘芳,焦李成. 模式识别教学实践与课程改革[J].计算机教育. 2010(19): 24-26.
[2]刘雨,孙即祥,余莉. “模式识别”课程开放式案例教学设计[J]. 电气电子教学学报. 2011, 33(3): 103-105.
[3]张灿龙,唐艳平. 地方高校研究生模式识别课程教改实践[J]. 计算机时代. 2014(9): 60-62.
[4]马丽,侯强. 以培养学生科研能力为目标的模式识别本科教学[J].中国电力教育. 2014(36): 133-134.
[5]孙丽慧,宋蔚.结合科研的模式识别教学改革尝试——以ECG信号分类为例[J].浙江科技学院学报.2016,28(1):78-80.
[6]陈锡爱,王凌,王斌锐,等.基于项目教学的图像处理与模式识别课程教学改革研究[J].教育现代化.2017(02):48-49.