孟小雪
提起数学,很多人第一时间就会想到苏步青、陈景润、华罗庚的名字。那个年代,他们进入数学领域,除了本身喜爱之外,更多的是为了让国家富强。当时,苏步青的老师曾说过这样一句话:“为了救亡图存,必须振兴科学。数学是科学的开路先锋,为了发展科学,必须学好数学。”也因此,苏步青的兴趣从文学转向了数学,并从此立下了“读书不忘救国,救国不忘读书”的座右铭。如今,数学似乎不再担此重任,但实际上,作为基础学科,数学仍然是很多新兴学科的重要根基。深圳大学助理教授欧阳乐就是将数学应用到生物信息领域的科研工作者之一,利用统计学习中的概率图模型,他为系统分析癌症等复杂疾病的发病机理提供了新的视角和方法。
2016年,中国启动精准医疗计划,旨在筹建中国人群全基因组数据库和样本库,为精准医疗奠定基础。欧阳乐介绍说:“现在各国都非常重视数据收集,并建立了统一的数据收集标准。经过多年积累,现在已经有了大量的生物医学数据。比如,遗传学数据、影像学数据、病理数据以及临床的记录数据。如何将这些不同形式的数据整合起来,从中挖掘出真正跟疾病有关联的机制,最后为治疗方案的制定或者是药物的开发提供指导和建议,是生物信息学现在主要研究的方向之一。”
2017年,基于信息和数理科学中的理论和方法,欧阳乐展开了“基于异构泛癌症组学数据的生物标志物识别研究”。主要从多任务差异分析模型构建、多视角差异分析模型构建和跨癌症类型的生物标志物识别三个课题进行深入研究。
欧阳乐总结说,传统的分析方法通常利用一种数据分析一类疾病。但利用同个病人的多种不同类型的数据之间的一致信息和互补信息有助于更准确地找到疾病标志物,这是研究的第一块内容。传统的生物标志物识别研究主要围绕分子标志物识别展开。但在生物体内,分子通常通过彼此之间的相互作用来执行特定的功能,所以从多个层次识别生物标志物,这是研究的第二块内容。传统的癌症分析,往往按照发病器官来划分,然后单独研究每种癌症。但是研究发现,同一个器官上的癌症,可能存在很大的差别,而不同器官上的癌症,虽然发病部位不同,但有可能存在相似的发病机理。所以在进行癌症分析时,同时分析多种不同癌症的生物标志物,然后识别不同癌症共有和特有的标志物,这是研究的第三块内容。
该项目在多组学数据融合、跨癌症类型生物标志物识别等方面取得了原始创新结果与实质性进展,开发了相关数据分析软件包6个,共计发表论文16篇,其中SCI论文15篇,EI论文1篇。
“从事这种基础性的研究工作,需要花大量的时间坐冷板凳,十分枯燥。而且有时需要头脑风暴来解决一些理论问题,十分费脑。但是,如果把一个难题解决了,或者是取得一些阶段性的成果,那一瞬间的喜悦,真的是觉得一切的辛苦都是值得的。”欧阳乐说。
欧阳乐
除了科学研究,在深圳大学,欧阳乐还负责教学工作。对欧阳乐来说,教书育人是一件很让人开心的事。
“我从小就对教师这个职业感兴趣,我觉得将自己的知识和经验传授给学生是一件很有成就感的事。”所以这几年,对于上进的学生,欧阳乐从来都是不遗余力地付出。
“学生取得成果那一刻,我最快乐。”在多年的本科生实践活动指导中,欧阳乐印象最深的是一次美国数学建模竞赛。回忆起这场紧张的比赛,欧阳乐至今记忆犹新。“虽然这种比赛常常需要半夜起来修改论文,但看到学生们拿到好的名次,内心还是很欣慰的。”欧阳乐笑着说道。
“科研的道路充满艰辛,但是如果将来的某项工作能对人类疾病的诊断治疗或者药物开发起到作用,对民生安全做出贡献,那所有的辛苦就全部值得。”抱着这样的信念,欧阳乐又坐在研究室内,开始了心无杂念的研究。