罗晓霞,夏占峰,刘琴,张晶,李浩,杨秋红,王彦芹
(1.塔里木盆地生物资源保护利用兵团重点实验室;2.塔里木大学生命科学与技术学院,新疆阿拉尔 843300)
塔里木大学建于1958年,秉承“用胡杨精神育人,为兴疆固边服务”办学特色,为新疆区域经济发展培养了一代代扎根边疆、献身边疆的有用人才。生命科学与技术学院建院以来,一直着力打造学科专业服务新疆战略性新兴产业,培养创新型、应用型、复合型高素质人才为目标。
人类基因组计划完成后,伴随测序技术的快速发展,生物信息学完成了大量模式物种的基因组测序,由基因组测序随之发展起来越来越多的组学,包括:转录组、蛋白质组、代谢组、糖组学及脂质组学等,因此产生了相应的大量的核酸序列、蛋白质序列、生物大分子的结构等生物分子信息数据呈指数增长,大量生物数据库及生物软件的增长也越来越快,生物信息学成为21世纪生命科学的核心课程。生物信息学是把基因组测序数据分析作为源头,破译隐藏在核苷酸序列中的遗传语言,特别是非编码区的结构和功能以及发现新基因信息之后进行蛋白质空间结构模拟和预测。通俗来讲,就是利用计算机工具对各种生物信息数据进行收集、处理、分类、存储,通过对各种生物数据采用各种统计分析方法、算法和模型进行分析,并结合生物表型,解释生物学想象的一门学科领域。对于21世纪生命科学领域的研究或技术人员来说,运用生物信息学工具从海量的生物数据中挖掘信息及发现新知识已成为亟须掌握的技能。因此,对于生命科学相关专业人才培养来说,“生物信息学”教学发挥着重要的作用[1]。目前,有很多高校开设“生物信息学”课程,对于教学内容和教学方式进行了积极探索,尤其是北京大学和山东大学的慕课公开课,产生了较好的反响[2]。本校生命科学相关专业都开设有“生物信息学”课程,为专业必修课,课程教学重点是为了提高学生分析问题的能力,要求学生能够熟练掌握基本的理论知识,如算法、模型及统计知识,以理论知识为基础选择合适的数据库及软件工具进行分析并得出准确结论。为了在有限的学时内全面提高各个专业学生生物信息学综合分析的能力,本文分析目前该课程教学中存在的问题,结合教学目标,通过完善理论教学,创新实践教学,理论实践一体化,综合考评体系的建立等方面确定具体的实施方案,从而提升教学效果和教学质量。
生物技术专业培养目标为立足南疆、面向兵团、服务新疆,掌握系统的生命科学基础理论、基本知识和现代生物技术基本技能,具有一定的科研素养,能在学校、科研院所、生物技术相关企事业单位从事教学、科学研究、产品研发、技术创新与推广等工作。生物信息学课程的学习就是为了培养学生能够综合性运用信息学软件及数据库分析生物学数据并根据分析的结果解释生物学现象,使学生在走上工作岗位前就具备生物信息学分析的研究手段。
在传统的生物信息学教学中,理论教学和实践教学脱节,全部理论课时上完再进行实践教学,教学效果不佳。因此,教师有必要在现有的教学方法的基础上进行改革创新,不断提高学生学习生物信息学的兴趣,能够把课本上的理论知识进行理解整合,融会贯通,在进行课程实践的过程中能自如地选择工具和软件进行分析,并能够正确地解释结果。
根据2018版塔里木大学生物信息学课程教学大纲的安排主要包括理论教学和实践教学两部分内容。其中,理论教学内容包括数据及数据结构导论、算法和程序设计等信息技术和统计学技术方面的理论知识,这些理论知识涵盖了实践教学的数据库的认识、检索和搜索,程序设计的理论知识与实践教学中的组学及大数据分析相对应。而生物信息学的教学目标培养通过学习,学生不仅能够理解数据及数据结构、算法和程序设计等理论知识,还在理解理论知识的基础上针对特征性的生物学数据选择合适的软件、算法、参数进行分析,并基于软件分析的结果解释生物数据。在网络及不同的数据库内,存在大量的离散数据,针对同一类的生物学数据进行分析的软件和模型复杂繁多,在参数设置及模型可选择性较多,针对同一组数据,因选择的软件和模型的不同会呈现不同的结果,利用计算机从大量的离散数据中高效获取有用的信息是生物信息研究的主要问题。组合数学的理念利用计算机处理离散数据,主要内容有组合计数、组合设计、组合矩阵、组合优化(最佳组合)等,生物信息学处理的数据大多为离散数据,在生物信息学理论教学内容中有必要增加组合数学的思想。在教学中,教师要让学生学会把组合思想和算法与生物信息学实际问题有效结合起来解决生物信息中的问题。比如,教师在实践教学中进行数据库搜索,进行序列比对,将需要比对的序列,包括核苷酸序列或氨基酸残基组成的序列分别排成一行来按照最相似的程度对两个或多个序列进行对位排列,最终出现对应位置的匹配、错配及空位等情况,然后通过规定的计分规则计算两条或多条序列间的相似性。
生物信息学基本实践教学内容包括序列比对、疾病的诊断和分类及生物网络的建立等,其中疾病的诊断和分类需要基础的凸规划问题;序列比对都是在基于动态规划模型的局部比对和全局比对算法中进行的,而生物网络分析的基本理念是基于图的最短路径算法,而运筹学是应用数学和形式科学的跨领域研究,利用统计学、数学模型和算法等方法,去寻找复杂问题中的最佳或近似最佳的解答,广泛应用于自然科学、社会科学、工程技术生产实践、经济建设及现代化管理的学科,具有很强的实践性和应用性[12]。因此,运筹学被列为生物信息学专业的专业基础课,而针对非生物信息学专业的教学内容在之前的教学大纲中没有涉及。通过教学改革,我们在理论课程的学习当中添加运筹学内容,利用运筹学的理念,针对特征性数据进行全局归类并建立合适模型,匹配选择合适的算法,并进行分析评估,最终得到最优方案,有利于培养具有全面知识体系的创新和具有综合分析和解决问题能力的生物信息学人才。
生物信息学是一门应用性课程,其教学目标就是通过学习,在理解理论知识的基础上针对特征性的生物学数据选择合适的软件、算法、参数进行分析,并基于软件分析的结果解释生物数据,而针对特征性数据进行软件、算法及参数的正确选择是生物信息学实践教学内容的重点,为了提升学生综合分析特征数据的能力,有必要对生物信息学综合实验教学内容进行改革及完善。根据创新型人才培养需要,有针对性地对生物信息学实践教学内容进行系列改革,建立特色生物信息学实践体系。比如,学生在执行自己申报的科研课题及执行毕业设计的过程中产生的一系列特征性的生物学数据,为了执行课题就需要进行生物信息学分析,这个时候学生就会有针对性地去选择软件、参数及算法,以学生能力需求及研究需求为导向的学习更能激发学生的学习兴趣,也就会认真学习,除了课堂上要求的知识体系之外还会追加更多、更深的内容以满足分析的需求,基于此设置的实践教学内容学生学习的效果就会得到显著提升。在生物信息学数据库的认识实验中,教师最基本的要求是学生必须要学会使用核酸序列数据库,蛋白质序列数据库,蛋白质结构数据库。了解数据的界面,特定数据的查询、下载及认识,将筛选到的与检测序列有一定相似性的序列,通过对结构数据库的检索,查询到相似序列的结构,基于一级序列、二级结构、三维结构的同源建模法及从头分析等分析氨基酸序列与结构之间的关系,介绍序列与结构对应的规律加深学生对“蛋白质序列决定结构,结构决定功能”的了解,并预测最佳的蛋白质二级结构预测方法。为了扩展学生的知识体系,通过教学改革在实践教学内容中增加基因组数据库、酶和代谢数据库,文献数据库等内容。以案例的形式综合使用各种功能数据库,比如,教师请学生分析氨基转移酶基因在大肠杆菌中的代谢通路,学生就需要综合了解核苷酸序列及蛋白质序列数据库、酶和代谢数据库及文献数据库的综合知识体系,才能明确分析方法。
为了在有限的学时数里,增加学生综合分析问题的能力,主要以案例式教学法,以教师的科研课题或者本科生自主申报的大学生创新项目的案例为素材进行实践。比如,生物技术专业的某学生申报的大学生创新项目:芽胞杆菌YC60菌株几丁质酶基因的克隆及异源表达,请设计几丁质酶基因筛选引物:首先学生必须要知道几丁质酶基因的序列,在微生物基因数据库中检索几丁质酶基因的序列,用多序列比对的工具进行分析几丁质酶基因的保守序列,利用Primer软件设计引物,在这个实验中学生需要综合运用所学过的软件,在教学过程中以小组的方式让学生分析自己课题项目的生物数据,能显著提高学生的学习兴趣,在设计引物的时候还会根据自身课题的需求对引物设计体系优化,选择合适的算法和模型,学生会自主了解算法、模型及参数等。学生真正变成了教学的主体,教学效果明显提高。
数据库的搜索实验中除了进行基本的Blast分析[5],调整比对的模式、算法及参数,并查看分析比对结果之外,通过教学改革在此基础上,添加本地Blast,是基于本地比对搜索工具,学生可以在自己建立的数据库进行blast搜索,与NCBI的在线blast相比,本地Blast的比对速度更快,搜索范围更小,且在没有互联网的情况下也可以进行比对。比如,学生已知道链霉菌的一个基因,并已经明确其功能,现在要在链霉菌中找序列相似度高的基因,就可以在本地建立链霉菌数据库,然后blast找相似序列。
随着大量物种全基因组测序数据的获得,大量基因组DNA序列产生,但对基因的注释远落后于基因测序。因此,应用计算机程序从DNA序列中寻找基因(尤其是那些编码蛋白质的基因),成为研究人员考虑的重要问题[6]。在教学改革中,教师有针对性地根据学生的毕业课题及科研项目为基础,分小组进行教学,研究相同物种的学生分为一组,针对某一类软件进行有针对的学习,基本操作环节基础上,让学生以小组讨论结合自学的方式对软件的扩展功能进行学习和练习。当学生学习了相关分析软件,便于学生在完成自己的毕业课题时选择合适的软件分析并指导自己的生物实验,学以致用,能有效提高学生的学习兴趣。据统计,2017—2021年,针对生物技术专业学生在有效合理地利用生物信息学软件完成毕业课题的同学占75%以上。
生物信息学进入后基因组时代,随着测序技术的飞速发展,大量的生物数据呈指数增长,这就要求科研人员在生物信息学方面具有数理统计分析、语言编程技术等方面的能力。在生物信息学研究中得到越来越多的应用和重视[9]。因此,教师通过对生物信息学实践教学内容的完善在课程设置中对组学数据分析方面安排6-8学时,帮助学生掌握Linux系统下基本的命令,让仅具有生物学背景的学生在了解生物信息学算法和应用软件的基本原理同时,基本熟悉一定的生物信息学编程,学生根据不同生物类型的组学分析软件活学活用,比如bioconda等安装一些生物信息学软件进行特征分析。教师要教会学生利用新技术、新方法以提高自主获取新知识的能力[13],为今后学习和科研打下坚实的学科基础。
在教学的过程中,教师发现很多学生过分专注于使用计算机工具或软件,但是对输出结果的解释能力较为欠缺。在实践教学的过程中,教师对于特定的软件任务均编写了详细的说明,并配有图片及标记说明,尤其是结果文件,针对输出结果的文件有详细的解释,并且对一些软件在执行过程中可能出现的报错信息也提出解决方案。完成课程学习后,学生应该能够进行熟悉常见的数据库;进行简单的BLAST搜索;进行多序列比对及系统进化分析;处理一些基本的结构数据,包括访问获取,在计算机上查看大分子结构等;对一些基因组数据进行基因预测及注释分析,并预测基因的启动子,终止子及非编码RNA等;同时学生还能采用“描红式”编程进行组学数据分析。
本课程教师在教授了相应的理论知识后,立即采用以实验课程表现形式的教学方式,可以避免理论与实验相脱节,帮助学生去理解晦涩难懂的理论知识,合理简化教材的理论内容,积极落实于实际教学当中,有效提高学生分析问题、发现问题与解决问题的能力。此外,针对目前教学过程中出现的问题,教师要将理论教学内容和实践教学内容加以完善。本团队联合新疆其他高校教授生物信息学课程教师编写适合新疆高校生物学专业生物信息学课程实验指导教材,将教学内容划分为不同的板块,板块内的知识体系可以相互融合,比如在传统的教学过程中,序列分析的内容主要是核苷酸序列分析及蛋白质序列的分析两个部分,通过教学改革,将数据库中的序列认识、检索、搜索及比对作为基础分析模块,理论教学中会讲到数据结构及数据库原理,实践教学就以核苷酸序列或者蛋白质序列为例,结合理论知识的学习,直接进行上机时间,可以把理论学习当中的一些晦涩难懂的概念及知识融入数据分析中去,既加深了理论知识的理解同时,也能够自如地运行软件,教学质量得到提高。教师可以按照此方法将知识体系以模块化进行合理整合,在实际的理论教学过程中插入实践环节,通过任务导入和任务驱动,在学生学习、操作过程中,逐步从简单到复杂,掌握知识,提高能力。
在传统的教学模式下,教学的主体是教师。在进行各个实验时,主要是以教师演示为主,导致在学习与应用上效果不佳,不利于学生的能力的提高和研究水平的发展,并且理论知识与实践技能脱节,学生对枯燥无聊的理论知识不感兴趣,实验教学趋于形式化,教学效果差。长此以往,学生表现出厌学的情绪,成绩不理想。
为了打破生物信息学理论教学和实践教学的脱节现象,本课程在教学方式上加以改进,将课堂理论知识的学习和实际的操作进行有机结合。比如,教师在讲授数据库相似性搜索的内容,需要针对序列比对的算法、得分矩阵及空位罚分体系等进行阐述,还需要学生了解比对的方式、比对的结果类型等。在介绍完算法时,教师让学生立即针对某一软件在选择不同算法时可能出现的不同结果加以解释,这样教师就能够及时了解学生掌握知识的程度,并及时指导学生在实践过程中所遇到的问题,加深学生对相关知识的理解和巩固。
根据本课程理论教学和实践教学的改革,本团队对该课程的考核方式也针对性地加以改革,制定理论和实践双重考核制度,其中实践内容考核比重大于理论内容的考核,增强考查学生对生物信息分析的基本技能的掌握程度以及对结果的分析能力。理论内容主要是通过让学生选择一个特征数据库或软件进行自学并撰写使用说明文件,这些说明文件可以作为生物信息学课程资源,理论考核成绩占30%,实践内容主要进行上机开卷考察,实践考核成绩占70%。培养目标要求学生能够熟练利用生物信息学数据库及软件对生物学数据进行分析并解释结果,在考核过程中要针对软件的综合性使用,学生自行在数据库中按要求进行生物数据的检索,并进行针对性的分析,同时解释分析的结果。这样的考核方式能够反映学生在该项课程学习中对数据挖掘技能的掌握程度。这种考核可以全面评定学生的学习效果,促进学生主动学习,准确地发现教师在教学过程中存在的问题,为课程教学的进一步优化提供指导。
随着生物数据量的不断积累,生物学正在转变为一门信息科学,生物信息学技术在分子生物学中的重要作用毋庸置疑。生物科学家逐渐意识到需要计算方法才能促进生物数据的分析,许多研究机构或团队迫切要求对生物学有深刻理解,并且具备计算和分析技能的专业人员[8]。为了优化生物信息学课程授课质量,本研究基于理论教学内容完善、实验教学内容创新、理实一体化教学实施、考核评价体系构建四个方面对本校生物学专业生物信息学课程进行系统改革,通过不同学科的交叉融合,加深学生对生物信息学理论课程内容的认识以及综合实践教学内容的熟练掌握。