罗 怡 徐秋梦 李德红
人教版高中生物学教材《分子与细胞》第2 章第2 节“生命活动的主要承担者——蛋白质”关于蛋白质结构及其多样性的叙述是:“在细胞内,每种氨基酸的数目成百上千,氨基酸形成肽链时,不同种类氨基酸的排列顺序千变万化,肽链的盘曲、折叠方式及其形成的空间结构千差万别,因此蛋白质分子的结构是极其多样的。这就是细胞中蛋白质种类繁多的原因”[1]。 相应的教师用书有关叙述实质等同:“由于氨基酸种类、排列顺序和肽链数目及空间结构的不同,就形成了分子结构不同的蛋白质”[2]。 该教师用书对蛋白质分子结构的4 个层次仅做简单介绍,未阐述4 个层次间的形成关系及一级结构对高级结构的决定作用。很多高中生物学教师据此总结:“蛋白质的氨基酸种类、数目、排列顺序及肽链的折叠方式(蛋白质的空间结构)是造成蛋白质结构和功能多样性的直接原因。 ”肽链的折叠方式,即蛋白质的空间结构,是引起蛋白质结构与功能多样性的直接原因吗?在肽链一级结构确定的情况下,其盘曲折叠方式还具有较大多变性吗?若同一肽链有多种折叠方式,还能通过有关软件,利用其一级结构准确预测其高级结构吗?
“结构与功能观”是极其重要的生命观念之一。蛋白质分子具体且专一的结构决定其功能,不同类型的蛋白质执行不同的功能。 蛋白质的结构包括一级、二级、三级和/或四级等多个结构层次。
一级结构为氨基酸组成及其排列顺序,是最基本的结构。 此外,二硫键也参与一级结构的形成,例如胰岛素蛋白分子由A、B 2 条肽链形成,A链内部有一个链内二硫键,A、B 链之间通过2 个二硫键连接[3]。因此氨基酸种类、数目和排列顺序的不同会直接导致蛋白质结构的不同从而影响其功能。 例如人教版高中生物学教材《遗传与进化》第5 章第1 节“基因突变和基因重组”提到:血红蛋白分子中的一个谷氨酸被缬氨酸替换,使得该蛋白质结构发生变化,由圆盘状变成镰刀状,从而失去携氧功能导致镰刀型贫血症[4]。
主链上一个氨基酸的羰基氧和另一个氨基酸的亚氨基形成氢键,致使一级结构中部分肽链发生卷曲或折叠形成二级结构,常见有α 螺旋(αhelix)、β 折叠(β-sheet)、β 转角(β-turn)、β 凸起(β-bulge)和无规则卷面等几种类型[5]。 若干个相邻的二级结构元件组合在一起,形成种类不多的、有规则的超二级结构,如αα、βαβ、ββ。 在二级结构或超二级结构的基础上形成相对独立的紧密球状实体,称为结构域,它是球状蛋白的独立折叠单位[6]。一条肽链在二级结构、超二级结构和结构域的基础上构建形成的包括主链和侧链在内的总三维结构,称为三级结构。
许多蛋白质分子含有多条相同或不同的具有完整三级结构的肽链,每条肽链称为蛋白质分子的亚基,例如血红蛋白便是由2 种亚基、每种各2个组成。 蛋白质分子中各亚基通过非共价键形成的空间构象称为四级结构,涉及亚基的数目、种类以及各亚基在整个分子中的空间排布[6]。可见,氨基酸序列从非折叠状态到折叠状态的复杂变化都基于蛋白质内部分子间和分子内原子间的相互作用。 因此,氨基酸序列已确定的多肽链,其折叠变化并非随意多样。
通过特殊途径折叠的蛋白质执行着非常专一的功能。蛋白质的空间结构一旦折叠错误,便将丧失其生物学功能,甚至引起疾病。为防止蛋白质结构的形成发生错误,细胞具有保证蛋白质正常功能的多层次“质量控制系统”,以保证在细胞生命过程中蛋白质表达的精确性[7]。
该系统包括DNA 复制的质量控制、翻译过程中的质量控制、翻译后的质量控制。 其中,翻译后的质量控制过程与蛋白质的折叠相关。 一些化学损伤、 热休克及其他刺激可以引起翻译完成后的蛋白质失活、去折叠或者错误折叠[8]。此时翻译后的质量控制一方面可通过分子伴侣与不能自发折叠的蛋白质结合,以帮助其正确地折叠;另一方面可利用细胞质中能量依赖的蛋白酶清除那些损伤不可逆的错误折叠蛋白,以保证细胞生命活动有条不紊地进行。 这也是为何蛋白质空间结构不具有随意性的另一个原因: 蛋白质一旦发生错误折叠,细胞便会通过翻译后的质量控制系统纠正或清除错误折叠蛋白。假若翻译后的质量控制失败,错误折叠的蛋白质积累,其浓度到达临界值时便会沉积产生淀粉样沉淀导致多种疾病,称为淀粉样变病。 常见的淀粉样变病见表1。
表1 常见的淀粉样变病[9]
1961年Anfinsen 等在实验的基础上提出蛋白质序列决定其空间结构的著名论断——在给定环境下蛋白质折叠所需的全部信息都包含在其氨基酸序列中,并因此获得诺贝尔奖[10]。 在生物的进化过程中,蛋白质的三维结构也比一级结构更保守[11]。 因此在计算机、物理、数学等多学科共同参与下,以蛋白质的一级结构氨基酸序列为起点,三维结构为目标的蛋白质结构预测方法得以发展,成为生物信息学的核心研究内容之一。 该方法能有效帮助细胞和分子生物学家探索从氨基酸序列到蛋白质空间结构的编码关系(被称为第二遗传密码[3])。同源建模法是一种较成熟的蛋白质预测方法,它根据结构已知的蛋白质家族成员(模板),通过分子动力学模拟方法和建模软件预测新序列的结构,从而建立序列与结构之间的编码关系。 该方法之所以行之有效,也是因为蛋白质空间结构具有很强的保守性,其折叠子(包括二级结构单元、二级结构单元间的相对排布位置关系及多肽链的整体走向)的总数目和类型是很有限的[12]。
众多学者对自然界可能存在的折叠子数目作了估计,我国的王志新院士认为仅存在654 种折叠子[13]。 若蛋白质的空间结构在其一级结构确定的情况下也同氨基酸序列一样具有巨大的可变性,这一涵盖了多个研究领域的第二遗传密码的研究方法就缺乏理论基础和事实依据。 只能先分离提纯蛋白质,然后利用蛋白质空间分析技术,例如核磁共振技术、X 射线晶体衍射法等费时费力的传统方法才可能了解其空间结构。
综上所述,肽链的折叠方式(蛋白质的空间结构)并不是引起蛋白质结构和功能多样性的直接原因。当氨基酸序列确定的情况下,肽链的折叠方式在很大程度上已经被确定,比氨基酸序列的组成更具有保守性。即便发生错误折叠,蛋白质分子也会被细胞的蛋白质质量控制系统纠正或者降解清除。若质量控制失败,错误折叠的蛋白质便会引起疾病。 而从氨基酸序列出发利用分子力学模拟方法通过建模软件预测出蛋白质的三维构象这一研究技术,也从侧面印证了一条多肽链的折叠方式是保守的,并不具随意性、多样性。
关于蛋白质结构和功能多样性的直接原因,教材和教师教学用书对该知识点的编写有些简单笼统,教师容易形成错误认知。笔者在知网以“蛋白质结构”为主题检索发现,在与中学生物学教学相关的期刊杂志中发表的论文多涉及蛋白质结构层次,却鲜有相关论文针对蛋白质结构多样性原因的认识误区进行剖析。 可见,有些高中生物学教师是割裂地理解蛋白质结构多样性的原因和蛋白质的结构层次这2 个知识点,忽视了二者的关联性。
类似这样片面地理解知识,忽视了知识与知识间的联系,作为知识的传授者要尽力注意和避免。 教师应增加对知识的理解深度,能由此及彼、由表及里地关注到知识点间的关联,进而完善自身的专业知识系统,这也有助于教师更好地展开教学,提高教学的科学性。