庄家俊,王前
(仲恺农业工程学院计算科学学院,广州510225)
数字图像是人类社会活动中最主要的一种信息载体,约占据人类所能获取信息的75%,它是对客观对象相似性的一种生动模仿或数字化描述[1]。一般的数字图像处理任务可视为利用计算机技术,通过各种加工手段改变输入图像的视觉效果并为后续图像分析与高级理解奠定基础。《数字图像处理》课程是高等院校计算机、信息和自动化等多学科的重要专业基础课程[2-3],该课程对学生的综合能力要求较高,需要学生具备扎实的基础数学知识、熟练的高级语言编程能力和算法设计与实现技巧,不仅是一门集理论和技术应用为一体的综合型专业课程,还作为学生课程设计和毕业设计所涉及理论的一种重要知识体系。
传统教学模式理论学时较多、实验学时较少,而理论教学内容普遍侧重于图像处理方法的数学原理、模型建立依据和相关理论推导等方面的问题,课程的理论性偏强,在实验学时数量较少的课程实践环节,则更多地倾向于数字图像处理基础方法的实验室验证层面。因此,传统教学模式并没有很好地将图像处理理论和方法融入到解决实际工程问题中,学生大都只能被动接受相关的理论基础知识,而缺乏动手能力与解决实际工程问题的能力的培养。另外,计算机、人工智能与传感技术在近几年中的显著发展及普及,亦推动数字图像处理领域产生了众多更实用、更有效的新理论和新方法[4-5],故亟需在《数字图像处理》课程的理论教学与实践环节中,融入与专业背景密切结合的最新研究成果和前沿性新知识,逐步更新甚至替换部分思想陈旧、实用性较差的教学内容,推动以工程应用为导向的教学模式建立与课程改革[6-9]。
目前,国内外广泛采用的经典教材有美国Rafael C.Gonzalez 等人著的Digital Image Processing[2]、清华大学章毓晋等人编著的《图像工程(上册):图像处理(第4版)》[10]、北京交通大学阮秋琦等人编著的《数字图像处理学》[3]等,不难发现,《数字图像处理》课程具有如下显著特点:①包含的教学内容较多,包括图像采集与描述、图像几何变换、空间域滤波、频率域滤波、图像增强与复原、小波变换与分析、图像压缩、形态学处理、图像分割、图像特征分析与理解、图像分类和目标检测与跟踪等,几乎所有的教学章节都可单独形成一个重要的研究方向,所以难以做到在有限的学时内讲授所有章节;②课程理论性偏强、内容更新速度快,不仅与基础数学和物理学、计算机高级编程语言、信号分析与处理等课程密切结合,还与众多实际应用或行业联系紧密,通常涉及人工智能与模式识别、计算机与软件工程、遥感与地理信息系统、通讯与电信工程、测绘工程、医学、印刷业等。作为一门融合多学科的课程,课程内容涉及的知识点会不断得到更新,所以与专业和行业应用背景相结合,适当配置或优化教学内容,将新理论和新方法融入《数字图像处理》课程是教学改革的必经之路。
传统教学模式下,通常视《数字图像处理》课程为一门理科课程,倾向于注重各类图像处理方法的数学原理与推导,因而学生在面临实际工程问题可能不知如何下手。考虑到该课程的显著特点,我们对信息与计算科学(软件工程)专业的《数字图像处理》课程进行了教学改革,重点结合实际工程应用开展相关的理论与实践教学,通过教师科研子课题或任务驱动的形式来培养学生的应用能力和软件开发能力,并进行课程考核。
我院信息与计算科学系的学生主要以算法设计、软件开发为主要培养目标之一,普遍拥有一定的数学功底、计算机高级语言编程基础和算法设计能力,并且他们毕业后大部分乐意从事信息技术行业,学生的上述特点很有利于教师优化《数字图像处理》课程的教学内容。为此,以美国Rafael C.Gonzalez 教授等人著的Digital Image Processing (3rd Edition)教材为基础,调整和优化了部分教学内容。近几年来,深度学习策略对数字图像处理领域带来了巨大的影响,这也是众多有关人工智能应用和图像分析与深层理解的基础,当前最为常用的卷积神经网络架构,其深层抽象特征均源自浅层的基本梯度信息,而浅层梯度信息的获取通常与图像的空间域滤波和卷积原理关系密切,并结合工程应用中常见的图像语义分割、图像分类、目标检测与跟踪和目标行为识别与理解等方向,将重点讲授图像信息的表示与描述、图像的几何变换、空间域滤波原理、图像分割、形态学图像处理、图像特征分析和深度学习策略等部分的内容。并在该课程的教学改革中,利用本院学生具备一定动手能力的特点,通过院系教师的科研课题和外界对数字图像处理任务的需求,同时引入数字图像处理中常用的开发平台和开源工具包,如OpenCV、MATLAB IPT 和TensorFlow 等,以进一步强化理论知识的实际运用,将教学重心转移到对具体知识的理解和实践能力的培养上。
即使经过教学内容的调整和优化,《数字图像处理》课程涉及的基本知识点仍较多,而该课程在我院开设的总学时是56,其中16 学时为实验教学,在有限的学时内容详细讲授所有知识点是不太可能的,并且所能提供的教学案例数量也是有限的,因此有必要提出针对本院学生基础和教学内容的教学方法。实际工程问题层出不穷,是否能通过有限的教学案例让学生学会举一反三,成功将学习与实践经验移植到其他类似的项目中,对于切实改善实践教学效果是非常关键的。
综上,我们结合实际工程项目,通过引入启发式教学方法详细讲授重要及基础的知识点。例如,在讲授图像分割章节中点、线和边缘检测的相关知识点时,通过课题组提供的行人检测任务来深入解析点、线检测理论中涉及的像素梯度和方向等基本信息对目标特征描述的重要作用,不会让学生觉得空间域滤波原理过于单调与枯燥。另外,为了进一步提高学生的学习兴趣与创新思维能力,通过充分调动学生的学习主观能动性,让他们切实去思考如何运用所学知识处理实际问题。例如,将常见图像处理App 和学生日常生活中的实际使用感受相结合,讨论和指出可以进一步改善的软件功能极其设计与实现思路;并多采用引导式手段鼓励学生积极思考和参与互动过程,如移动端图像处理软件Faceu 在人脸贴图之前可以考虑添加人脸性别或年龄识别功能模块等,并通过MATLAB 和Python等平台以直观的方式向学生演示相关系统功能改善的流程与运行结果分析,对于学生兴趣浓厚的学生来说,这些较为新颖的想法更有利于锻炼他们的动手、实践和自我创新能力。
此外,我校作为项目牵头单位主持了2018 年第一批Google 支持教育部产学合作协同育人项目——人工智能技术领域的数字图像处理课程建设,将TensorFlow引入到该课程的实践教学中。
传统考核与评价体系中,课程考核主要通过期末闭卷考试与平时出勤的方式执行,一般期末闭卷考试在课程总评中占据的比重为70%。显然,对于以理论和实践联系密切的《数字图像处理》课程来说,传统考核模式并不合适。为了考察该课程改革措施带来的教学效果,我们替换传统的期末闭卷考试,取而代之,在该课程结束前的4 星期布置开放性的小课题,要求学生以2 人一组的小团队形式开展为期约2-3 星期的课后课程设计。由于课题具有开放性,所以学生可结合平时使用桌面端或移动端相关数字图像处理软件的体验与感受,或选择本院课题组教师提供的选题依据或背景材料,如用于光学相机的人脸检测与笑脸拍照、自然场景中的成熟果实检测与果柄定位、文本文档重排、车牌定位与识别、工件表面缺陷检测、专用滤镜设计与自动美图、快递单号自动批量导入、基于内容理解的图像检索、无人机航拍图像序列匹配与全景拼接、面向植保无人机的相关航空图像处理应用等。以解决实际问题为导向,通过组队成员调研课题背景、存在的问题,完成项目需求分析、确立课后课程设计题目及拟采用的技术方案,分工合作并上机编程实现,要求最终完成一款面向桌面端和/或移动端的数字图像处理系统(软件),同时按照本院软件工程类本科毕业论文的设计要求与格式,撰写相关的课程设计报告,并参加课程设计作品的现场答辩,教师在该过程中的作用主要是引导、启发学生及答疑,课程设计的评价方式采用类似毕业答辩的形式开展。这种课程考核方法有利于综合评价学生在新教学模式中凝练的概括、归纳、分析、比较、抽象和综合演讲等能力,这种开放性的课题执行方式,给学生提供了更多了的思考与实践机会,逐步让他们体会到学习与实践的乐趣、体验“learning to learn”的思维方式(机器学习)。
《数字图像处理》具有很强的理论与实践并重的课程特点,结合信息与计算科学(软件工程)专业学生的前续修学课程和拟从事的行业,以工程应用为导向进行课程教学改革,重新定位了课程的教学重心,并调整和优化了相应的教学内容、提出了基于工程案例的理论教学方法,同时将项目分组执行模式等引入《数字图像处理》的课程教学过程与考核体系,有利于学生更好地掌握数字图像处理技术的基本理论知识,能从根本上提高学生的数字图像处理算法编程技巧、切实增强学生的实践操作能力。