生物信息学在草业科学专业教学的探索
——以青岛农业大学为例

2023-10-10 09:37
草业科学 2023年9期
关键词:草业信息学数据库

宋 辉

(青岛农业大学草业学院, 山东 青岛 266109)

生物信息学(bioinformatics),是由Paulien Hogeweg和Ben Hesper 两 位 博 士 于1970 年 依 据 荷 兰 语(bioinformatica)创 造 的 名 词[1], 其 英 语 单 词bioinformatics 于1978 年被首次使用。美国国家卫生研究院对生物信息学的定义为:为扩展生物学、医学、行为学和卫生学数据的用途,而进行有关计算机方法手段的研究、开发与应用,包括系类数据的采集、存贮、整理、归纳、分析与可视化。虽然生物信息学以计算机科学为基础,但该学科隶属于生物学范畴。生物信息学的快速发展得益于人类基因组计划的实施。人类基因组以及模式生物基因组的破解,产生大量核苷酸序列和氨基酸序列,单纯利用人工对数据进行整理、归纳和分析渐显弊端。在此背景下,计算机技术介入生物学的研究,促进了生物学在组学研究的发展。

草学是生物学领域一门重要的学科,传统的草业科学偏重生态学研究。但是,随着分子生物学的不断发展,草业科学研究领域早已深入到细胞和分子水平。草业科学工作者借助转录组等组学研究,已深入揭示了牧草耐旱、耐冷、高产等多个性状的形成机制。最近,我国科学家相继完成多个牧草的基因组测序,包括紫花苜蓿(Medicago sativa)、无芒隐子草(Cleistogenes songorica)、草木樨(Melilotus suaveolens)、假俭草(Eremochloa ophiuroides)等[2-5],标志着我国草业科学研究已迈入基因组学时代,有利于牧草抗性、优质、高产相关基因的挖掘和利用。但是,草业科学研究者所具备的生物信息学知识有限,限制了在基因组层面开展数据分析。因此,应尽快对草业科学专业的学生进行生物信息学相关知识的授课,培养后备人才。青岛农业大学于2006 年设立了草业科学专业,主要从事牧草分子育种、生态学和草坪草研究。近期,课题组开展了百喜草(Paspalum notatum)、红三叶(Trifolium pratense)等牧草的基因组测序工作,但生物信息学的研究背景薄弱。于是,青岛农业大学于2019 年开设了生物信息学概论与实践课程,以期提高学生的生物信息学分析能力。现就授课过程中遇到的问题和解决方案做一个总结,希望能为后续授课的教师提供参考。

1 生物信息学在草业科学专业的授课问题

青岛农业大学草业学院于2019 年开设了生物信息学概论与实践课程,为专业限选课。现将授课过程遇到的问题概括如下。

1.1 学生对该课程缺乏认识

经过中学时期对生物学课程的学习,学生对植物学、动物学和微生物学等传统学科已有深入的认知。但是,学生对生物信息学相关课程缺乏认知。因此,学生很难认知本课程的研究内容、意义和目的。授课期间对学生进行调研,为何选修该课程。学生一致回复,为了修学分。由此证明,学生对授课内容缺乏兴趣。因此,要求授课教师一方面讲授课程内容,重塑学生的学识结构;另一方面,还需提高学生对课程的认知,使学生深入认识以及理解本课程的地位,强调该门课程在今后科学研究过程的重要性。

1.2 学生背景知识薄弱

开课伊始,授课教师对学生的基础知识缺乏认知。学生缺失或未掌握分子生物学相关课程的知识。在讲授美国国家生物技术信息中心(NCBI,National Center for Biotechnology Information,https://www.ncbi.nlm.nih.gov)数据库时,学生无法完全理解NCBI 数据库建立的意义。再则,在讲授系统发育关系时,学生对共同起源、中性选择、分子钟等内容部分或者完全不了解。在授课过程当中,专业名词高频率出现。虽然教师对其逐一解释,但是学生在短时间内难以理解。例如,在讲解序列比对原理时,学生对于动态规划、全局比对算法、局部比对算法等难以接受。背景知识的缺乏,使学生在心理上产生了畏惧心理。刘文献老师在兰州大学讲授R语言作图时,面临了相同的问题[6]。

1.3 教材选用困难

生物信息学教材繁多,但目前没有针对草业科学专业的教材。一般而言,国内生物信息学教材主要包括数据库检索、序列比对、系统发育树构建、蛋白质结构与性质、常用生物软件或网站、基因组结构注释等内容。国外教材,虽然也囊括了以上知识结构,但是教材还涵盖了计算机编程语言等。这些教材的适用对象主要面向生命科学或者计算机科学专业人员,他们具有良好的分子生物学、生物化学、数学和计算机科学等背景知识,对国内外教材均能驾驭。反观草业科学专业学生,缺少对以上课程系统地学习,在教材选用上存在一定困难。

1.4 授课单一,缺少相应实践

生物信息学的授课主要采用课堂讲授的方式,课程内容包括了生物信息学的发展、数据库的分类和检索、序列比对(包括算法)、系统发育树的构建、蛋白质结构与性质。该授课方式并不理想。在授课过程,学生多低头玩手机;如果对所讲内容进行提问,多数情况得不到正确回应。学生反馈效果不好,未对生物信息学有深入的理解,不能熟练使用公共数据库。例如,不能熟练使用NCBI 数据库检索序列、下载序列等。

生物信息学虽然有其独特的基于生物学和计算机科学背景知识的理论框架,但是,对于生命科学(包括农学和草业科学等专业)背景的学生而言,能够熟练使用生物信息学已有的程序和公共数据库是首要任务。因为软件的开发和公共数据库的建立需要具有深厚计算机背景知识的人员开发,生命科学背景的学生短时间内难以达到相应水平。另外,草业学院缺少生物信息学专用计算机机房。虽然可以借用计算机科学专业的机房,但是,生物信息学相关软件的购买、安装、调试等工作仍需专业教师的辅助。专业教辅人员的缺失也限制了相应实践的开展。

2 教学探索与优化

基于在教学过程中发现的以上问题,在随后的教学过程做了教学的探索和优化。现总结如下,希望能为授课教师提供参考。

2.1 增加实例,引起学生学习兴趣

在授课过程中,增加科学故事,将其设计为思政元素穿插到整个教学过程,激发学生的科学兴趣,并使其理解科学家艰辛的工作[7]。科学或者科学家相关的故事包括博物学家(生物学家)与宗教的关系、关于进化论的三次大辩论、拉马克和达尔文比较、人类起源与迁移等。这些内容一方面引起了学生对生物学发展的认识;另一方面,有些内容涉及了生物信息学的范畴,引起学生对生物信息学的认识。例如,人类起源与迁移涉及到了系统发育关系的鉴定和推导,与本门课程具有亲密的关系。

2.2 弱化计算算法,加强分子生物学知识

基于学生基础知识薄弱,对授课内容做了调整和优化,弱化了涉及计算算法的部分、简化了算法的推导、增加了分子生物学知识。生物信息学程序算法的工作主要由计算机科学相关背景的科研人员完成,生命科学背景的科研人员能够熟练运用相关程序完成科研工作即可。学生对算法内容的恐惧心理严重。基于这些考虑,本次课程删除了该部分内容。增加的分子生物学内容主要包括DNA 复制、转录、翻译、转录翻译调控等内容,占用2 个学时。类似的修改在之前的教学改革中已有探索,兰州大学草地农业科技学院教师们对草类植物种子学的授课内容进行了冗余内容的简化和删减,以及最新研究进展的添加,获得了良好的教学反馈[8]。

2.3 综合现有教材,制定授课内容

国外教材《生物信息学与功能基因组学》[9]虽然内容充实,但是32 学时不能完成授课,且教材价格过高。与此相比,《生物信息学应用教程》[10]通俗易懂,是生物信息学的入门教材,但是该教材的适用人群仍为生命科学相关人员。为了授课的需要,综合了《生物信息学与功能基因组学》和《生物信息学应用教程》的内容,加入了实践内容,制定了青岛农业大学草业科学专业学生的生物信息学概论与实践课程的授课内容(表1)。增加了Endnote、Adobe Illustrator、 Beacon Designer、 MAFFT、 IQ-tree、Figtree、HMMER 等软件,以及部分R语言作图的应用。除此之外,讲授了转录组学、蛋白组学和代谢组学在科学研究的应用。为了满足课时要求,对数据库检索、序列比对、系统发育关系、蛋白质结构与性质等内容进行了压缩,着重偏向软件操作能力的讲授。

表1 生物信息学概论与实践的授课计划Table 1 Teaching plan of Fundamental Concepts and Practices of Bioinformatics

2.4 自备电脑,增加实践

授课方式采用课堂讲授和实践操作的模式。课堂讲授主要包括生物信息学的基础知识以及生物进化的相关知识。除此之外,授课过程,要求学生自带笔记本电脑。一方面,向学生演示软件和数据库的使用。例如,Endnote、NCBI 数据库、序列比对、系统发育树构建等。另一方面,指导学生统一安装软件,做自己电脑软件的维护者。鼓励学生多动手操作,出现问题,在课堂及时解决,促进了学生的学习热情,减少了课堂玩手机学生的数量。

3 考核与教学效果评价

本课程采用考查方式进行考核,注重考察实际操作能力。例如,在NCBI 检索规定的基因,使用BLAST 程序比对,获得至少5 条同源基因,随后构建系统发育树(图1);提交每一步操作截图和纸质文档。考核结果显示,学生在适当指导下均能完成规定操作(图1)。该类型考核着重考查了学生使用生物信息学相关软件的能力,为将来从事科学研究打下坚实基础。另外,软件的熟练使用也能使学生进一步了解以及理解软件的运行原理(或算法),反馈到理论知识的自我学习。

图1 期末考核Figure 1 Final test

4 结语

生物信息学相关课程是草业科学专业的新课,所参考的授课经验有限,因此,笔者对该课程的授课进行了探索。目前,形成了课堂讲授和实践操作相结合的模式,逐渐提高了学生的上课热情。随着草类植物基因组的不断破解和多组学数据的完成,已产生大量序列数据。草业科学专业需要更多的科研人员能够使用生物信息学方法助力科学问题的解决。希望本文对草业科学专业生物信息学课程的授课探索,能够为其他授课教师提供参考,进一步完善本课程的授课,培养更多的优秀人才。

猜你喜欢
草业信息学数据库
青海草业
鸡NRF1基因启动子区生物信息学分析
初论博物馆信息学的形成
2017 年第1 期《草业科学》审稿专家
数据库
数据库
数据库
数据库
2015年3月草业科学大事记
2015年6月草业科学大事记