基于R语言的医学院生物信息学课程教学探新

2023-08-26 04:34:07唐丹丹张志豪田翔华
电脑知识与技术 2023年19期
关键词:R语言生物信息学项目式教学

唐丹丹 张志豪 田翔华

关键词:生物医药数据专业;生物信息学;教学探新;R语言;项目式教学

1 生物信息学介绍

生物信息学(Bioinformatics) 是一门以计算机为工具,研究生物信息采集、处理、存储、传播,分析和解释等方面的新兴交叉性学科,是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一[1]。随着高通量测序技术的快速发展,生物医学数据的快速积累,当前,我国对生物数据分析人才的需求日益激增,如何培养复合创新型生物类专业人才成为医学院校急需解决的问题[2]。生物信息学课程建设在生物类专业建设和人才培养方案中具有重要地位。近年来,我国各大医学院校都相继针对相关专业的本科生开设了生物信息学课程,并取得了一定的成效[3-8]。笔者针对医学类高校生物信息学课程教学实践中存在的问题,提出了生物医药数据专业生物信息学课程建设和改革的相关建议,旨在通过该门课程的改革,提升学生大数据采集、处理、分析与挖掘能力,解决应用领域问题;培养一批具有创新思维能力的生物信息学专业人才,满足我国生物医学数据科学的发展需求;为今后的同类教学提供一些借鉴和参考。

2 课程发展历史

2020年,为满足研究生的科研需求,新疆医科大学首次面向研究生开设了生物信息学公共选修课程,以满足学生对生物信息数据分析学习的兴趣和需求。开设课程之初,选修该课程的学生人数相对较少。以2023年春季硕士研究生班的选课情况为例,可以看出,一共有13名同学选择该课程,其中12名学生来自基础医学院,覆盖人体解剖与组织胚胎学、遗传学、生理学、法医学、病理学与病理生理学、生理学、免疫学、生物化学与分子生物学以及中西医结合临床等专业(见表1) 。

近年来,随着生物信息学的快速发展,国内外各种生物医学研究机构、生物医药企业以及高校对生物信息学研究和生物信息学技术服务的人才需求不断增加,越来越多的高等院校和科研单位纷纷针对生物信息学相关专业开设生物信息学课程,培养生物信息学复合型人才,以满足我国生物医药产业、生命科学发展的新需求。自2021年新疆医科大学开设生物医药数据科学专业以来,目前共招收了两届生物医药数据科学专业的学生,75名学生中,男生35名,女生30名,男女比例为1:1.6。生物信息学作为生物医药数据科学专业的核心课程,注重锻炼学生的动手能力,重视学生对生物信息学的基础理论知识和分析方法的掌握,从而培养学生从事生物信息数据分析与挖掘的能力。

3 生物信息学课程教学中存在的问题

第一,师资力量不足。生物信息学是一门跨领域的学科,涵括生命科学、物理、化学、统计、计算科学与数据科学等专业学科,授课老师不仅要具备信息学与计算机科学的平台开发与数据处理技能,同时还要了解生命科学、基础医学等生物信息学的背景知识,而在国内医学院校这类复合型人才十分稀缺。以新疆医科大学为例,生物信息学课程划分在信息科学教研室,目前教研室只有两名教师能够承担该门课程,授课教师的缺乏严重阻碍了该门课程的持续发展。第二,教学方法和教学手段设置不合理。生物信息学是一门重实践的课程,着重培养学生的生物信息数据处理与分析能力,而国内大多数医学院都将其设置作为专业课模块中的选修课,以传统的面授理论教学为主,实验教学多以学生课下自行练习为主,这就使得学生学习兴趣不足,动手实践能力薄弱,不能熟练地掌握课程内容。第三,教材和教学内容陈旧。随着高通量测序技术的快速发展,多模态、多层次、高维度、非线性的复杂生物数据不断增加,生物信息学的研究内容日新月异,国内医学院现有的大多数教材内容過于陈旧,滞后于生物信息学的发展,学生学习的内容无法满足科研和工作需要。第四,缺乏教学和生物信息数据分析平台。目前,大多数医学院校及科研机构都没有自己的生物信息数据分析平台,教学实践也只是停留在简单的小样本数据分析,主要依靠学生自己的笔记本电脑完成数据分析,没有高性能的服务器,一旦数据量过大,就无法满足教学和科研需求。因此,医学研究和教学迫切需要有价值的生物样本和数据资源集成平台,以满足日益增长的研究需求。

4 生物医药数据科学专业生物信息学课程建设探新

鉴于研究生生物信息学课程中存在的普遍问题,从生物信息学实践性强、内容更新快的专业特点出发,探索和改进教学模式和教学手段,生物医药数据科学专业本科生的生物信息学课程建设可从以下四个方面开展。

4.1 基础课程建设

随着人工智能、大数据和生物医药数据新一轮科技革命和产业革命的快速发展,医学教育模式正朝着“医学+X”交叉学科的建设转变。生物医药数据科学专业是一个典型的多学科交叉专业,其生物信息学课程建设需要紧跟新医学的发展前沿,建立多学科交叉融合的课程体系。对应培养目标要求,课程可分为“公共课程”“医学基础”和“生物医药数据科学”三个大模块和七个子模块。其中核心课程包括以下22门:R语言基础、Python语言程序设计、SAS基础、数据结构、数据库应用技术、概率论与数理统计、基础医学概论、分子生物学、生物信息学、临床医学概论、药学概论、流行病学、生物统计学、生物信息学、生物医药数据挖掘、机器学习、深度学习、Hadoop和Spark基础、运筹学、数值分析与统计计算、药物数据分析、流行病建模与预测、临床试验设计。这些核心课程的设置包含了生物信息学所需要的医学基础知识、数学和计算机分析技能以及生物学基础知识,是生物医药数据科学专业毕业以后从事生物医药数据分析、高校教师、科研人员、临床医生等工作需要掌握的技能。除此以外,为了培养学生实践动手能力,课程应设置与理论教学同步的实验课程,包括基础性实验、综合性实验、验证性实验及设计性实验,充分调动学生的动手实践能力,培养学生的创新能动意识,使学生能够符合新医学的发展需求。

4.2 基于R 语言的项目式实践教学

生物信息学主要借助计算机,通过统计学方法分析生物信息数据来揭示其中包含的内在信息,它需要一种功能强大的数据处理和分析软件作为工具。目前常用的生物信息分析软件有Python,Perl语言和R 语言。Python作为一门高级编程语言,支持函数式编程,面向对象编程,拥有庞大的社区及标准库。Python 更加注重数据处理和自动化流程,虽然其越来越流行,但是在数据可视化方面Python与R语言还有很大差距。Perl语言对过程、档案和文字有很强的处理能力,跨平台、执行效率高、简单易学,但可读性差。R 语言作为生物医药大数据处理的关键技术,在生物信息学领域应用非常广泛,它不仅开源免费、易扩展、资源丰富,而且还具有Bioconductor这种提供了大量开源和开放式的生物信息学分析软件包集成开发项目。Bioconductor 主要用于分析和理解高通量基因组数据,其在统计上用严谨的方法对设计的实验进行微阵列预处理和分析,并且对生物信息学处理有综合和可重复的方法而获得了很高的可信度。最新Bioconduc? tor3.16版中提供了2183个软件包,用于表达和其他微阵列、序列分析、流式细胞术、成像和其他领域,这为R语言教学和学习提供了强大的资料来源,也为培养学生解决实际问题创造了可能性,并提供了有效途径,基本上能满足本科生和研究生的生物信息学分析需求。除此以外,R语言在生物信息数据分析可视化方面相比于Python、Perl具有绝对的优势。R语言有一系列的数据可视化包,包括基础绘图系统的graph? ics包,高级绘图系统ggplot2、lattice、leaflet、playwith、ggvis、ggmaps包等。基于R语言的PBL实践教学以生物信息学真实问题作为实训项目,项目分为三个阶段:基础阶段、实战阶段和创新设计阶段。基础阶段,首先对学生进行分组,让学生参与到自己感兴趣的教授团队和课题研究组,选取相应的负责人主持项目任务的实施和工作部署。学生可从老师布置的真实问题中学习项目任务中涉及的生物信息学的理论知识(例如转录组、蛋白质组和代谢组等)。第二阶段,学生在导师的引领下,解决项目中不懂的问题,导师给学生们布置一些与课题任务相关的论文阅读任务,学生需要基于阅读内容撰写阅读报告并进行小组汇报。学生通过基础阶段的学习已经了解了项目背景和相关的专业基础知识,实战阶段学生将以R语言作为生物信息学分析的主要工具来模拟操作生物学数据,完成项目的计算机模拟实验练习。第三阶段,根据项目实战分析结果,撰写研究报告,学生将有机会通过不同类型的项目实战,达到既定学习效果,加深对学科知识的认识,树立知识创新的思维。

4.3 组建跨学科的师资团队,发展医工结合创新型教师人才

在现有人才队伍基础上,建立跨学科的教学团队,授课老师可以由来自计算机学、统计学、分子生物学、遗传学和微生物学等专业的教师担任。同时,也可以聘请公司有经验的生物信息工程师,教师可以根据自己的专业特长,实施团队教学。例如,擅长生物信息平台开发数据挖掘的生物信息工程师可以讲授Linux系统、Hadoop和Spark等课程。

通过线上线下各种学习途径对现有教师进行专业的培训。例如聘请生物信息学专家开展讲座、参加学习班、网上慕课学习等多种方式提升教师的专业技能。通过创新团队建设,引进人才。引进1~2名生物学、生物信息学博士;引进1~2名生物学、生物信息学硕士;培养1~2名生物信息学博士,使三个研究方向有3~4名学术带头人和5~10名学术骨干,形成科学研究和教学的学科梯队,建立一支15人以上的、相对稳定、团结协作和结构更加合理、教学和科研水平较高、解决实际问题较强的教学队伍。

4.4 建设生物信息学高性能教学平台

随着高通量测序技术的快速发展,生物医药大数据急剧增加,生物信息数据的计算分析需要搭建高性能的生物信息学计算平台。在医学工程技术学院现有实验室的基础上,新增“生物信息学研究中心”,建立两个生物信息学专用实验场,通过学院领导层牵头立项招标,投入一定比例的经费,聘请专业的团队搭建一个融教学科研计算、海量数据处理、信息管理服务于一体的高性能计算校级公共服务平台,满足学校各学科领域对于大规模数据处理和大规模科学计算的普遍需求、 专门学科领域对于高性能计算的特殊需求、各院系日常教学对于高性能计算的基本需求,为学校的重点学科建设和高素质人才培养提供有力支撑,初步实现学校建设高性能计算校级公共服务平台的初衷和目标。

5 结束语

在当今大数据时代,生命科学领域的数据产出能力在各学科中处于领先位置,数据量迅速增大,数据类型不断增加,促进了生物信息学的快速发展。生物信息作为一门涉及多学科交叉的前沿科学,在生物信息获取、加工、储存、分配、分析等方面发挥着重要作用。因此,熟练掌握生物信息学课程已成为当今生物医药数据科学专业高校对学生的必然要求。經过两年的研究生学院生物信息学课程教学实践和不断的探索,研究生教学已经取得了一定成效,形成了针对研究生的特色教学手段。结合研究生生物信息课程教学中存在的不足,本文对医学院高校生物医药数据科学专业的生物信息学课程建设从基础课程建设、基于R语言的项目式教学手段、教师人才队伍建设以及生物信息学建设等方面提出了相应的改革建议,希望学生通过对生物信息学这门课程的学习能够广泛提高解决实际问题的能力,提升生物医学数据的分析处理技能,不断满足学生的科研和工作需求;希望教师能够进一步提高生物信息学课程的教学质量与效果。

猜你喜欢
R语言生物信息学项目式教学
民办本科高校新闻专业项目教学的实践与思考
今传媒(2016年12期)2017-01-09 22:12:28
基于GPS轨迹数据进行分析改善城市交通拥挤
论项目教学在高职计算机网络技术专业课程教学中的应用
基于R语言的Moodle平台数据挖掘技术的研究
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
今传媒(2016年11期)2016-12-19 11:35:50
中医大数据下生物信息学的发展及教育模式浅析
初中生物项目式学习活动的探索
数据挖掘技术在生物信息学中的应用
高职《液压技术》课程教学改革探索
科技视界(2016年22期)2016-10-18 17:25:54