赵东旭,冯永君,王丰,张金凤
(北京理工大学 生命学院,北京 100081)
生命的起源问题即自然历程中如何由无生命物质演变为有机分子乃至生命有机体是生命科学的基础问题,也是数百年来本领域及相关领域的学者持续关注并努力探索的课题[1],而且大众对此问题的解析也充满兴趣和期待. 抛开寓言或传说,如西方《圣经》中上帝七天创世的故事、我国古代盘古开天地、女娲抟土造人的神话传说,较早的研究可始于达尔文关于物种起源的论述,其中揭示了众多动物间、植物间可能的演化关系[2]. 当代,基于对生物化石考古学、解剖学及同位素分析等方法,使得我们可以较系统地认识生物进化的大致脉络和进化机制. 化学家乐于从自下而上的角度分析生命的起源,由无机小分子生成有机小分子进而生成生物大分子,最终形成最原始的生命,而生物学家则是从自上而下的角度以现存的高等生物之间的形态、结构与功能方面作对比,反推至最初的原核细胞,并以此推测原核细胞可能的形成过程[3-4]. 但是,无论从何种角度分析,限于无法完全模拟以重现当时的环境条件等原因,研究人员尚未对生命最初始阶段或原核细胞之前的相当长的“至暗时刻”给出一个相对清晰的描述. 文中将借助化学、生物化学、地球演化的基本理论及逻辑学理念对这一交汇点可能发生的事件进行分析,以尝试还原当时的状态,并籍此重点探讨遗传物质传递的中心法则的建立逻辑和基于此法则的真正意义上的原核细胞的起源问题.
现已清晰,生命体(病毒除外)均由细胞构成,而此处所说的细胞是由最早的原核细胞逐步演化而来的. 那么最早的原核细胞又是从何而来或者说生命缘何而起?针对此疑问,文中提出“生命源于偶然,却具有必然性”的观点.
之所以提出上述观点,主要是基于科学家对46亿年前的地球初始状态的假设以及当代的实验分析.米勒(S.L. Miller)在1953 年进行了基于原始大气的放电实验,产生了氨基酸、甲醛、杂环化合物等有机小分子[5],验证了前苏联科学家奥巴林等人提出的地球上的“原始汤(primordial soup)”概念,说明在CH4、NH3、H2、H2S、CO、水蒸气等分子存在的条件下,如果遇到自然界中惯常存在的雷电可以形成上述生物小分子并进一步生成它们的衍生物等,也许这些最初的无机及有机小分子成分(如前文提到的CH4、NH3、H2等)不是同时产生的,但在千万年甚至更长时间因各种核裂变、宇宙射线等剧烈因素的存在而有产生上述小分子成分的可能,基于此前提,必然存在产生上文提到的氨基酸等生物小分子的机会[5]. 原始汤中因放电实验产生的甲醛可聚合成各种糖类化合物,进而形成核苷酸、肽类、寡糖等,以后再借助自身结构化学等原因形成更大的分子. 因此,在我们现在所归纳的生命的演化至少包括化学进化(从小分子形成生物大分子)、自组织特征(生物大分子发展成自我组织与自我复制能力)、生物进化(从简单生物形成复杂的现代生物)等核心内容中,生物小分子的产生是提出生命的化学进化乃至生物进化观点的重要支撑及必然前提,当然,也使生命的诞生成为可能.实际上,在此之前,英国学者霍尔丹(Haldane)、贝尔纳(Bernal)也曾提出了利用无机小分子合成有机小分子的设想和办法[6].
在著名的“米勒实验”之后几年间,其他科学家又利用各种不同的能源,如紫外线、冲击波、射线、电子束、高温加热、强光照等,或改换混合物中的不同成分,结果是生成更多且更复杂的分子,其中有些与生物活细胞中的分子一样,从某种程度验证了米勒实验的结果与意义[7-8].
关于生命起源的化学进化,我国学者赵玉芬教授的团队也提出了他们的见解. α-氨基酸连上磷酰基团(这种小分子或基团在当时的情况下是极有可能存在的)形成N-磷酰-α-氨基酸后,在水中或有机溶剂中能够自组织成肽. N-磷酰-α-氨基酸的过渡态是一个五元环的五配位磷酸与羧酸的混酐,其中磷中心被羧基激活,因此可以发生磷上的酯交换反应;尤其与核苷的核糖上的cis-2’,3’ -diol 能发生两个酯交换反应,而把核苷转化为核苷酸[9-10]. 而且,当组氨酸与磷相连成N-磷酰组氨酸时,它甚至具有切割DNA 的功能,而N-磷酰丝氨酸在组氨酸的饱和溶液中,于-40 °C 放置2 周后,也可以切割DNA,进一步的研究表明,是反应生成的丝组二肽完成了对DNA 的切割任务[11]. 除组氨酸外,其他如丝氨酸、门冬氨酸在N-磷酰化之后也有自组织成肽的能力.
尽管对米勒实验条件的假设或推论有一定质疑[7-8],但基于对地球形成初期时高温、压力、雷电频次及强度、宇宙射线等的不确定性以及相对简单的大气成分,经过无数次的外力撮合,反应的复杂性或某一反应的单调重复均有可能发生,这自然会导致多种简单化合物或生物小分子的出现.
同样,在此高能量输入、剧烈的反应过程中势必会产生类ATP(或ATP 样)、磷酸肌酸等具有高能磷酸键的小分子或其他高自由能分子,这些分子也必然会参与其他分子的反应. 后来,ATP 等高能分子在物质代谢和能量代谢过程中发挥了巨大作用,当然这仅是一种选择的巧合而已.
从上述分析可知,从时间维度(或大历史维度)看,组成生命的生物小分子成分的形成是偶然的,当然也是必然的,只是时间的早晚而已. 那么,早期偶然产生的化学反应为什么易产生上文所提到的不同的环状化合物?
尽管自然界中硅元素的含量远高于碳,而且二者的核外电子排布很相似(碳是1s22s2p2,硅是1s22s22p63s23p2),在形成共价键时较易按杂化轨道的方式进行,但由于硅的质子数多,对核外电子的束缚力会远高于碳,硅不易失去核外电子而成键,由此也就出现了碳基生命. 当然,也有一些关于硅基生命方面的分析或推测,有兴趣的读者可自行了解一下.
早期产生的化合物中出现5 元环或6 元环分子架构具有深厚的化学基础. 米勒放电实验及其他相关的质疑、验证实验中均出现了5 元环或6 元环类的化合物,而且现在不同生命体中存在的天然有机环状化合物也多是5 元环或6 元环结构,很少见到超过7 元环的化合物. 尽管有些分子也具有复杂的环状结构如卟啉环、甾醇类、维生素类、其他的多环类次生代谢物等,但这些成分均是由相关单体聚合或衍生而成,其单体仍是5 元环或6 元环. 那么出现此类情况的原因是什么?这就要从碳基化合物的构建基础谈起,即基于sp、sp2、sp3杂化轨道的成键规则. 对于碳基化合物,因多数碳原子均采用sp3杂化的成键方式,各基于C-的单键形成四面体锥形的非线性空间结构,在分子链超过4C 或5C 时,相距较远的碳原子必然会因单键方向的即时转向而靠近,便为新键的形成提供了可能. 尤其是当与5C相连的元素是电负性较大的元素如O、N 时,相距近的基团间成键的概率会更大(实质上就是形成小的闭环结构),而大环类化合物即便是在偶然条件下形成了,但又不是足够大到可以形成相对紧凑的结构,反而更容易受到外来因素的破环(即降解),所以大环结构未能较好地被保留和“遗传”(此处只是借用该词,而不是现在所说的真正意义上的遗传).
类生物大分子的出现是生物小分子产生后的自然延续,同时也是地球极端环境趋于平和所导致的必然结果. 因当时产生的大分子成分或许与现在所熟知的由遗传信息传递所控制的生物大分子有些不同,故称之为类生物大分子. 在文中,尤其是在涉及到早期生命过程时比较普遍地采用此种称谓,即“类……”方式.
现已清楚,作为在生命活动中起重要作用的四大类生物大分子即糖类、脂类、蛋白质和核酸的共同特征主要有:1)由小分子结构单元聚合而成;2)组成生物大分子的结构单元有特定的排列顺序;3)结构复杂:既有线性信息(即一级结构),亦包括三维信息(即空间结构). 此处作简要介绍:四大类成分均有各自的组成单体或单元,构成生物大分子的结构单元分子按不同的排列组合,形成数量庞大、结构复杂的线性分子或环状分子. 单元分子中能够参与反应的活泼基团愈多,形成聚合体或聚合物的种类也就愈多,相同的单元数量,排列顺序不同,形成的寡聚体也就不同. 例如,单糖因含有多个羟基,在形成寡聚体时可以形成种类繁多的不同寡糖,而核苷酸或氨基酸仅能形成数量有限的寡聚体. 通常将仅涉及结构单元的排列顺序的结构类型称为一级结构. 生物大分子在线性或环状结构(如淀粉的糖链、原核细胞的染色体等)基础上,通过分子内或分子间的基团(包括极性、非极性和带电荷基团)的相互作用,只要条件不是十分苛刻就可以进一步形成非常复杂的空间结构,此即为生物大分子的自组装能力. 例如,盘绕成螺旋状,折叠成片层状,甚至进一步形成球状结构等,其中的组成单元是理解三维结构的关键. 在了解生物大分子结构的基础上,下面用逻辑学的方法分析这些大分子可能的产生机制.
如前所述,在放电等相对极端条件的存在下,会形成一定量的生物小分子,或许地球当时的极端条件有小幅度波动,但整体上看这种反应会持续很久,由此会产生难以计数的有机小分子及其类似物、衍生物,而且,产生的小分子中或富含活泼基团(也就是我们现在所熟知的-COOH、-NH2、-OH、-SH 等).由于浓度高或自然条件的相对极端抑或有短时的、局部的平和,便有可能促使小分子聚合,产生多种多样的纯聚合物或杂聚合物. 由于聚合反应的一个重要特征就是简单、单调/重复、随机,再加上自然条件的催化反应性能以及反应物单体有活泼基团且浓度较高等因素,所以,从逻辑上看,类生物大分子的产生是不可避免的. 其实,我们对一个常识性内容进行反推即可知道这一点,如果不是自然条件产生了最初的聚合物,那么是什么因素导致其聚合的?所以初期聚合物一定是在自然条件(非生物催化)下完成的. 重要的是,这类分子产生后,就必然产生多种多样的或不稳定的二级结构或三级结构,这一点可以从现在所熟知的蛋白质的自我折叠、单链RNA分子的自我折叠、某些多糖自发形成螺旋状结构中得到印证. 由于参与形成生物大分子的单体的不确定性,空间结构的不稳定也是常态. 更进一步分析,在空间结构中局部出现多种活泼基团甚至起某种类型生物催化功能的现象便悄然出现,这其实也是一种必然,本质是它们跟某些结构互补物按“诱导契合”方式结合并产生“过渡态”,这是由立体结构的多样性和复杂性以及所携带的化学基团的活泼性所决定的. 籍此,便开始了某种弱的或强的、持久的或短暂的基于类“生物酶”的聚合反应,当然也包括分解反应. 前面提到的赵玉芬团队研究结果中给出的如丝组二肽对DNA 的切割作用等就是对上述推测所给予的很好的例证. 在当时自然条件下,只要有产生聚合反应的可能,哪怕只是小的聚合体合成,就有可能呈现一定的催化活性,就可以催化较长的聚合反应.
譬诸核糖核苷酸与RNA,不同类核苷酸之间有区别的关键是碱基的不同,可以设想,在早期产生某种嘌呤或嘧啶时是无序、随机的,必定有某种相似的成分所在,现在所知道的嘌呤主要有2 种,嘧啶主要有3 种,实际上反映了早期反应的随机状态(注:随机性这一概念是生物分子产生、相互间反应的真实状态,是文中论述的重要数学基础). 在这些单体随机合成聚合体即类RNA 的过程中必定产生诸多无序、无固定结构的随机聚合体,这是早期化学反应(还不能称作是生化反应)的常态,对于化学反应的调节,考虑到天然物理条件的不稳定性,其他非典型的类生物酶(基于蛋白质或RNA,或二者的聚合物,抑或包括其他大分子成分. 后面详述此内容)的不稳定性等,使得平衡的调节相对简单,产物的反馈调节或原料供应是否充足很可能是其调节反应速度的主要方式. 在漫长的演化过程中,那些不能够参与聚集体形成的单体或其类似物的合成会很缓慢,而那些能够参与聚集体合成的分子可以持续合成,这种反应过程对小分子单体、聚集体都是一种逐渐筛选、逐渐淘汰的过程. 当然,该过程也离不开“类生物酶”活性稳定、特异性等方面的形成与持续变化/改进. 强分解性、非特异性的结果甚至会导致自己也不复存在. 经过反复博弈,终于演化出分子结构比较稳定、活性比较稳定、催化作用相对单一(特异性的序曲)的纯类RNA 聚集体或杂类RNA 聚集体,或者说这样的分子必然胜出,因为只有这样的分子才能够形成丰度优势,相比之下,所有其他的类型都显得势单力薄,逐步被稀释或者由于不能“再生”而被淘汰. 当然,该过程同样对组成单体的核苷酸的形成过程(或步骤)也是一种筛选,也就是说,与目前所熟知的4 种核苷酸的类似物得以保留.虽然现在仅存在4 种参与遗传物质RNA 构建的核苷酸,但我们不能反推早期也是这4 种核苷酸. 长期演变的结果就是在后来的囊泡状结构中所出现的类RNA 的形成、分解过程的相对平衡(当然也包括其他所有的反应),此时相互间反应速度的调整多依赖于反应物量的多少或浓度的高低,整个体系处于混沌状态.
类蛋白质的合成与分解情况与之类似. 无论是自然条件下的随机过程,还是在某种“类生物酶”催化下的合成都是很随机的,而且类蛋白质与类RNA之间没有相应的关联(此时可能暂不涉及DNA).
综上所述,关于早期借助自然条件产生的类生物大分子,应该以随机性为主,而且长度不一,后来由于“类生物酶”的介入,使得这一过程变得具有一定的可持续性. 早期形成的类生物大分子聚合物对整个体系的发展(注:按现在的视角理解,暂且定义为体系的逐渐结构化、作用逐渐特异性(指结构特异性或催化反应的特异性等))方面的作用也是偶然的、分散的、不可持续的,譬如,具有耐分解性,可能利于结构化或区隔化,或有较强的促进新成分合成的能力等性能时,则可以促使原来的混沌体系特异化;若是仅具有极高的耐分解能力且不利于使体系结构化,本质上对体系的发展作用可以忽略. 当然,这种情况是很普遍的. 若是具有极高的分解其他化合物的能力,则会使本来就不容易建立起来的结构化体系而重新趋于混乱状态,甚至威胁到其自身能否较持久存在,这种分子也会逐渐被体系所抛弃,当然,这是一种被动抛弃,体系不在,此类成分也就随之消失. 从现有的生物化学知识中关于酶作用或特异性方面的内容可知,尚未发现广谱、高活性的降解酶存在,更多的情况是酶的活性虽然也很高,但多针对特定的键而且对键周围的其他基团等要求也比较高,如现在用途较广的胰蛋白酶,其仅降解碱性氨基酸的羧基参与形成的肽键等.
接下来分析类细胞结构的形成. 随着“原始汤”中的各种生物小分子及其衍生物逐步形成并且浓度逐步增加,因此借助于大气放电、宇宙射线、局部相对高温、尤其是个别生物大分子或聚合物的特异性催化能力,便逐步形成种类繁多的基于不同单体的纯的或杂合的寡聚物或多聚物. 下面以一个具有5个不同反应位点(注:对于一个已经形成的小分子,具有5 个活泼位点已经很多了)的分子X 为例进行分析,若仅是两个分子连接,则会有5×5 即25 种方式,可形成25 种新的二聚体,若是10 个分子形成十聚体,则约有107种化合物,也就是说按特定连接顺序如稳定的1 位→5 位形成的线状聚合物(1 位→5位)10的概率约为10-7. 此值看上去概率很低,但若与阿夫伽德罗常数6.02×1023相比,1/107级别还是相当高的(1/107>>1/1023). 这是从单体分子的大小及所可能具有的活泼基团的多少对有可能形成聚合物情况的分析.
下面再从分子极性方面进行分析. 如果形成长的烷烃链且在末端带有一定的极性基团而成为两亲性分子,则在水相中会出现微胶囊甚至是双层膜结构,这种结构的形成完全由于分子的亲疏水性所决定,近乎是自发的(这涉及到生物大分子的一个非常关键的特性即前文提到的自组装能力. 如在淀粉形成过程时,葡萄糖分子累加到一定数量就会形成左手螺旋结构,而纤维素链则会形成纤维素微晶;肽链形成螺旋、未配对的DNA 单链形成双螺旋等均是如此,完全取决于分子内的结构),即囊泡状结构的出现只取决于末端带有极性基团的长链分子能否形成.如美国加州大学的David W Deamer 等于上世纪70年后期模拟前生物存在的条件,基于最常规的化学试剂如甘油、脂肪酸/乙醛、磷酸盐在加热条件下,参考其他人以硅铝酸盐为催化剂的研究,以氧化硅或黏土为催化剂合成出生命膜组分甘油磷脂等[12],进而基于单链两亲性分子(细胞膜主要磷脂是双链两亲性分子)构建简单的脂质体,由此指出其在构建生物膜模型中的潜在优势[13]. 由于认识到基于脂质的两亲分子的天然属性,研究人员开始进行人工细胞构建方面的探索. 如加拿大大学张明瑞(Thomas M S Chang)教授在1964 年首次用高聚物分子包裹细胞[14],构建人工细胞,以使其完成其生物学功能,后来逐渐演变成以脂质或高分子聚合物包裹某些细胞组分或结构或某些酶类形成的囊泡以作为类细胞或类生命结构,到本世纪初,所合成的结构具有一定的遗传信息复制等特征[15-16],这不但有助于我们对生命起源的认识,更重要的是藉此可以构建仿生性强的低免疫性的药物包裹、递送甚至缓释系统,以满足临床需求. 根据上文的分析,在以万年甚至更长的时间段为时间单位计时,具有极性的长烷烃链分子的形成是必然的,这是由基于化学反应的必然性和随机性所决定的. 实际上即便是采用非磷脂类溶液,如类蛋白溶液,也可以在水相中形成微球体[17]. 因此,囊泡状结构或类细胞结构或类生命体的出现看似偶然,实则必然,这就是生命出现的化学逻辑. 生命源于化学,必须按化学原理和逻辑向前演化.
现已清楚,克里克(CRICK)等初始提出的遗传信息中心法则蕴含的内容包括遗传信息从DNA 到RNA,再从RNA 到蛋白质的表达,随后的研究对以上内容进行了补充或修订,即遗传信息也可以从RNA逆转录到DNA 或从RNA 复制到RNA,这种法则或程式是由蕴含在DNA 或RNA 结构内的遗传信息所决定的. 现在我们也熟知,不论是原核细胞还是真核细胞,不论是单细胞生物还多细胞生物,在自然生存状态下,每时每刻都存在着由数以千计的借助酶促化学反应/过程形成的代谢网络,尽管每个网络都是可以精准调控的,但在生命初期即生命起源时期常规“代谢”(非现在意义上的代谢)网络的各环节及环节之间由于具有很大随机性所导致的相互间的关联性是不能与遗传信息传递的精准性相比的. 那么,遗传信息为什么最终通过蛋白质来完成其内在使命?我们又该如何理解非生物合成或起源上随机的,甚至同时出现的类蛋白质、糖类、RNA 或RNA/DNA等类生物大分子为什么能最终进化出遗传信息从DNA 到RNA 再到蛋白质的主流顺序或则说生命过程的遗传信息的传递是如何形成这一看似神一样的程序化操作(保守程序)?本质上看,这两个问题是密切关联的,且具有逻辑递进关系,下面首先对第一个问题即“生命体为什么选择蛋白质作为其生命现象的体现者”进行逻辑分析.
如前所述,理论上,生命起始于以氨基酸、核苷酸、单糖、脂肪酸及其衍生物为主的小生物分子的非酶促合成(或称为非生物合成),进而在随机情况下形成单一或混合的聚集体,这些聚集体具有不确定的三维结构. 从我们现在对酶促反应机制的解析过程可知[18],生理条件下,只有蛋白质或RNA 分子(当然主要是蛋白质)的三维结构才能为酶分子对底物的识别、结合、作用起到机械支撑、空间撮合的动力或基础,而活性中心的活泼基团如羧基、氨基、羟基、巯基、咪唑基等则刺激相近位点上的底物分子上的活泼基团或结构,最终促使已有化学键的断裂及新键的形成或基团的转移. 这就是蛋白质作为高活泼性成分所具有的内在的或天然的化学逻辑,即整个分子架构的相对稳定和活性部位及其中的活性基团的相对充足和稳定. 在对蛋白质类酶作用机制理解的基础上,下面进一步分析生命诞生初期其他有可能作为酶催化作用的生物大分子及其聚集体.
早期混合体系中含类蛋白质的复合物或聚集体应该有多种,下面首先分析RNA 及其RNA-蛋白质聚集体. 上世纪80 年代初期,具有常规酶活性的非蛋白类酶即核酶的发现颠覆了我们对“酶就是蛋白质”这一普遍性知识的认知,也使我们对生命起源的认识赋予新的内容,这就是作为遗传信息载体的RNA 的起源很可能早于DNA 和蛋白质[18-21]. 非生物合成的RNA(亦包括生物法合成)长链由于自身具有形成局部双螺旋且在其基础上折叠形成三维结构的可能性,再加上具有一定的活泼基团如中强酸度的磷酸基团、羟基、氨基等,因此具有一定的反应活性(按我们现在对酶活性的理解,这种反应活性就是酶活性),但是考虑到其主链结构的简单重复,使得三维结构的形成不但不太稳定(注:其二级结构即螺旋结构形成具有一定随机性,比如区段A-区段B 之间可以形成双螺旋,B 与C、A 与C、C 与D 等亦有可能形成局部短的双螺旋结构,进而形成的三级结构自然比较随机),其酶活性也就差别迥异而且功能也相对单一;至于RNA-蛋白质聚集体在进化和逻辑上应该是更具活性的,但由于磷酸相对于羧基具有更强的酸性,而使得其自然条件下的酶催化过程不具普遍性. 而对于蛋白质-RNA复合体,因已经含有蛋白类成分,使得该聚集体的中的RNA 所体现的酶催化特征没有必要得以保持和完美遗传,只是在一些特殊情况下才得以显示,如在蛋白质合成中,真正催化肽键形成的是位于核糖体大亚基上的23S 或28S RNA(关于这一点,后文有进一步的探讨). 因此,从化学逻辑以及前文提到的在生命早期出现的类生物大分子产生时的随机性分析,“RNA 的合成一定早于DNA 和蛋白质”尤其是“RNA 的合成一定早于蛋白质”的结论值得进一步商榷. 下面先从合成蛋白质原料的角度来分析二者起源的先后顺序. 从米勒实验及其他实验的结果看,氨基酸属于“初级产物”(借用现代生命科学对代谢过程的描述,下同),而核苷酸是在形成戊糖、碱基之后并在一定的条件下才能进一步合成,也就是说核苷酸(实际上,仅碱基而言,其合成过程亦非如氨基酸等初级产物般简单)属“次级产物”,因此仅从逻辑上分析,来源于初级产物的蛋白质的出现应该会早于来源于二级产物的RNA. 然后再从两种单体的结构分析. 相对于核苷酸的结构复杂性程度,氨基酸的结构是相对简单的,因此其产生过程在理论上也是早于核苷酸的. 由此,若从逻辑学的视角分析,蛋白质的起源应该早于RNA,当然也早于DNA. 至于真核生物对内含子进行剪切的剪接体,尽管含有百余种蛋白质和多种RNA,根据惯常的酶作用机制,实际上不需要特别的空间体积和种类众多的组分,因此有理由推测,剪接体组分是与基因组重复序列类似的,就像在诸多真核生物基因组如人中真正编码蛋白质的序列也就是1%左右(若把内含子计算在内,外显子及对应的调控序列、内含子也仅占整个基因组的25%),在剪接体中真正起模板或“卡尺”作用的RNA 组分也是极低的,其他的蛋白质和RNA 都是进化不彻底所致,或者说该聚集体的形成是随机的或冗余的. 与正常组分和结构的适量冗余不同,在剪接体和基因组中保留了太多的冗余. 另外一个具有典型酶催化活性的蛋白质-RNA 聚集体就是端粒酶,其中RNA 也只是起模板作用,起催化活性的仍然是蛋白质.
其次是DNA 及DNA-蛋白质聚集体. 很显然,作为与现在的结构成分如纤维素、角蛋白、胶原蛋白、壳聚糖、丝素蛋白等具有类似线性结构的DNA,由于不宜形成相对紧凑的三维结构和局部富含活泼基团的可能,因此DNA 不具有担负酶催化能力的物理基础. 至于DNA-蛋白质聚集体显示其催化活性,更是没有必要了,或许在生命进化的早期阶段,该聚集体具有某种特定酶催化能力,由于其不具有比单一蛋白更多的优势,所以也就没有被遗传所保留,因此尽管有报道DNA 单链表现出一定催化活性但并未引起较大轰动[22-23].
再次是糖类、糖类-蛋白质聚集体、脂类、脂类-糖类聚集体、脂类-蛋白质聚集体. 不论是单一的糖类、脂类还是二者的聚集体多是形成相对单一的三维结构,使得局部富含活泼基团的机会明显下降,而且由于活泼基团的相对单一,使得其缺乏蛋白质类的酶催化能力;至于二者与蛋白质的聚集体,由于没有提供具有某种特色的活泼基团(糖类的羟基、脂类的羧基等在蛋白质中都是普遍存在的),因而这类聚集体具有酶活性的特征便没有被进化所青睐.现代分子生物学也非常注重糖蛋白及脂蛋白的研究,但这些非蛋白组分的加入只是改变了蛋白质的附着活性、降解稳定性、工作环境等等,主要不是改变催化活性中心的作用机制.
综上,无论是纯的类蛋白质还是类蛋白质与其他生物大分子形成的复合物,其高度特异性和高活泼性是其他生物大分子所不具备的,因此,与其说生命现象选择类蛋白质作为生命的体现者是生物长期进化、选择的结果,倒不如说是由于类蛋白质的高度特异性和高化学活性才促使了生命的诞生和进化.
对生命的解构离不开对其演化过程的分析,在上文对蛋白质作为生命活动体现者的化学逻辑结果进行分析的基础上,下面详细分析为什么生命体形成遗传信息从DNA 到RNA 再到蛋白质的主流顺序.
为了较系统地表达文中的观点,在前文提及囊泡状结构形成的必然性的基础上,此处有必要再次强调该结构形成的巨大的现实意义. 从囊泡的组成和结构上看,相对于寡聚肽/蛋白质、寡聚核苷酸/核酸、多糖类等生物大分子,脂肪酸及甘油或其类似物的结构相对简单些,因此从逻辑上,非生物合成的磷脂或类磷脂结构的出现很可能会早于其他几类生物大分子. 当然,即便是不早于其他大分子的出现也不影响下面的分析. 由于类磷脂分子在较低温度下、水相等相对温和的自然条件下具有形成囊泡状结构的天然特性,尽管蛋白质或与多糖类成分在温和条件下也可以形成团状结构[7],但基于类磷脂形成的囊泡状结构与刚才提及的团状结构相比,前者更为稳定且内部是包括了多种水溶性成分,也就是说内部与外墙(也就是“细胞膜”或“墙壁”了)是不同的,假如有对上述结构中的成分可以进行降解即所谓的“酶”存在,由于屏蔽效应,“酶”是不能降解内部成分的. 在两亲性分子自发形成囊泡结构时甚至包裹一定蛋白质、RNA、DNA、糖类以及它们的组成单元等成分,这种结构的形成某种程度仅与温度的变化与自身在水中的浓度有关. 这种相对稳定的囊泡状结构实际上就是细胞的雏形,与目前所了解的由细胞膜组分形成的微囊(脂质体)十分接近.
在囊泡状结构中包括了诸多来自于非生物合成的多种大小不同的蛋白质或类蛋白质、多糖或类多糖、RNA 或类RNA、亦或包括DNA 或类DNA、大分子相应的单体以及由上述分子以不同形式、不同配比共价结合的复合物、无机离子等. 需要强调的是,尽管有蛋白质、RNA、DNA 存在,但三者的合成反应之间没有逻辑关系(关于RNA 与DNA 合成先后的问题,下文会专门分析),也就是说,我们现在提出的中心法则在当时是不存在的. 但有一点是可以肯定的,这就是越是稳定的生物大分子越是可以保留较长的时间. 对于具有降解能力的成分,如前述的蛋白质或类蛋白质成分,其活性高低、活性对于环境的适应或耐受是至关重要的,活性太高会导致所有的生物大分子的寿命显著降低,甚至威胁到自身,其结果是自身也难以形成稳定的结构并长期存在,从哲学的角度看,不利于量变,当然更不利于质变即生命雏形的产生;若蛋白类成分降解能力低,因为体系仍处于非生命状态,只是体系内成分的变化相对缓慢而已,亦不会对体系的质变造成大的影响. 此处所要重点强调的是,不论是降解反应还是其他类型的反应很可能都是基于蛋白质或蛋白质-RNA 复合物的酶促反应;多种慢速反应并存,随机性强,调节性弱或多是基于反应物匮乏的被动调节,而且,这种状态会持续很长的时间,或许是在亿年级的范围内.
囊泡状结构及生物大分子形成后,它们具有自我稳定、自我更新、自我选择、自我演化的能力或天然属性,这与生物大分子的内在属性和地球物理条件的趋于平和有关.
如前所述,尽管此时蛋白质、RNA 抑或包括DNA 等也已经合成并存在于囊泡状结构中,但我们不能认为它们是在为生命做准备. 我们必须认识到,尽管蛋白质、RNA、DNA 等对生命非常重要,没有它们就没有生命,但这些成分产生后,其天职工作就是适度地合成自身及其他成分、适度分解自身及其他成分,被动性地保证自身的相对稳定,无关生命,也就是可以将这些过程戏谑为是“鼠目寸光”.囊泡状结构形成后,它自身的命运主要受到几方面的影响. 首先是自身成分. 利于形成囊泡状结构并使之有一定韧性时,便会有较长的存活时间,同时,在水中毕竟会受到其他化学成分的影响,也随时会受到物理上的剪切力的影响. 从理论上,会存在大小不一、柔(刚)性不同的囊泡,暂且不须考虑所谓的膜表面受体、多种离子通道蛋白,甚至连最基本的水通道蛋白也是不存在的,此时膜上或镶嵌或贯穿有某种疏水性较强的蛋白,但这只是因为其与膜脂成分有较强的相互作用而碰巧参与了囊泡状结构的构建而已. 此时,囊泡状结构亦可能会变大,这只是由囊泡间的融合所致,甚至有内、外水分子以及其他小分子通过囊泡膜上某些空隙的有限交流,这是一个随机扩散过程,与主动运输无关. 长大的囊泡也会因外界剪切力的原因而破碎或分散成较小囊泡,甚至以某些部位突起并以小囊泡形式离开本体,小囊泡之间甚至会自动聚集而融合,这种所谓的“分裂”或“增殖”过程源于外界物理因素及囊泡结构、自身成分的影响,只是一种机械式的物理作用. 实际上,直到目前,与小囊泡类似的团聚、聚集或聚合现象在进行涉及微米颗粒和纳米颗粒如用作药物载体或示踪剂的微粒体研究中仍然是一个普遍存在且难以克服的问题,这与材料本身的强疏水性有关.
那么,囊泡状结构最终的走向到底是什么?按照反映于自然界的开放体系属性的热力学第二定律以及耗散结构的特征,囊泡状结构的命运无外乎上面所说的大变小,甚至变无,或小变大再变小或消失.只要两亲性分子不被分解(由化学、类生物因素导致的),那么这个过程就会永远的持续下来. 在此过程中,囊泡状结构内某些蛋白质或RNA 的分解活性及聚合活性的有无与变化情况等在本质上最终确定了囊泡的走向(注:环境条件无极端变化). 这一点是我们理解囊泡逐渐功能化的关键,也就是说,当蛋白质、RNA 等高活泼型分子的分解与聚合活性保持相对平衡的情况时,不但保持了囊泡状结构的稳定,同时也保证了囊泡内、外的各种化学反应的平衡,这实际上也是一个囊泡与活性成分相互筛选的过程. 囊泡为里面的所谓的活性成分提供了相对稳定的环境,而活性成分的反应逐步单一化又为膜成分的增加或稳定提供了一种可能,长期演变的结果就是活性成分对膜的危害愈来愈少. 因为,危害愈来愈大的话,整个体系也就不复存在了. 如果以某一个蛋白质为例,当这个蛋白连它自己都彻底分解的话,基于这种蛋白质的体系便消失了,此时便会有其他基于某种蛋白质的体系取而代之(早期有无数种蛋白质可以满足这一要求). 经过长时间的演化,原来囊泡状结构中的复杂体系终于出现对膜结构破坏小、对自身结构及其它成分有针对性分解能力的系列蛋白、系列RNA 及其他类似物,终于建立了一个相对稳定的体系. 故,进化意味着等待,意味着无穷无尽的选择. 所演变的结果就是产生/筛选能够使各成分之间相互平衡的、一种由多成分共存的混合体系,当然,蛋白质、RNA 或其混合物是关键. 我们所熟知的现在的个别细胞成分尽管有较强的分解能力,但整体上看,还是很适度的,这可以说是一种自然选择,也可以说是迫不得已. 本质上体现出了生物催化剂的生物学逻辑. 由此,这种思路也会为我们理解“在生命起源时是基因优先(Genes-first)还是代谢优先(metabolismfirst)的困扰”提供一种新的视角[24-26].
囊泡状结构在一定的自然条件下产生、积累后,实际上也会反馈到成分的产生过程,有利于成分稳定的产生过程会不断得以强化,而不利于成分稳定的产生过程会逐步消失. 那么,对于脂肪酸类成分及甘油脂类成分,由于结构的相对单一,借助天然的或当时的物理极端条件很可能比较容易实现,反应过程某种程度上是一种单调的重复. 即便是采用的由蛋白质或RNA 或蛋白质-RNA 复合物合成的方法(不能理解为如目前教材中所给出的由脂肪酸多酶复合体所完成的合成机制)也是一种重复过程. 当然,在脂类形成时,由于活性基团(-COOH、-OH)对接的相对专一性和自身结构的相对简单等特点,使得其产物结构也相对简单并呈现一定的惰性. 但是对诸如单调但又有区别的蛋白质、RNA、DNA 等分子的形成,虽然也是重复累加单体的过程,但关键是必须对不同单体有一个识别并且有内在的顺序安排,这样才能保证把这些不同单体按照既定的程序(可以增加丰度)连接起来,这其实就是遗传物质及其体现者合成过程所依赖的基础,即模板反应或者说客观上存在这样的需求(详文见后面的分析).
囊泡结构内必然有关乎能量的摄取与转化的问题. 有学者基于组合化学(combinatorial chemistry)的方法(具体内容后述)探索RNA 在生命起源早期的作用时,在人工合成的众多RNA 群体中筛选出了可与ATP 结合的RNA[27],在此研究的基础上,我们不妨作进一步推测,既然随机产生的RNA 分子能够结合ATP,那么不排除其中的某些结合可能会以我们现在所提出的“诱导契合”方式进行,既如此,必然是会使ATP 产生某种过渡态,从而出现能够水解ATP 的能力,进而促发某些藉靠能量消耗才能进行的化学反应,当然也包括合成RNA 自身. 能耗是现在存在于生命体中常规反应的常态,在生命起源早期,在类生物大分子形成后,ATP 或其他形式的高能分子才会逐步介入到某些耗能过程. 某种情况下,这种耗能过程会因产物的相对稳定而使这一过程相对稳定,甚至被保留下来. 从现在我们对单个个体的生命过程看,全然就是一个能量耗费或者说能量聚集的过程,尤其是在其生命的早期和中晚期之前,一直是一熵减过程,在个体生命晚后期之后,由于摄取的能量不足以维持现有的耗散体系/结构了,生命体才趋于熵增,以致最后的熵最大. 我们由此可以推测,在生命起源早期,有效的耗能过程/反应具有被体系保留的可能性明显高于非耗能过程/反应,而囊泡状结构的存在极大地保证了系统和环境之间的隔离,以使体系的熵维持尽量低的水平.
囊泡结构的演化过程离不开其内部成分的演化. 生物大分子的演化过程,不仅仅是保留分解、合成等活性,其自身稳定性也是非常重要的,而这种稳定性是与其结构紧密度有密切关系的,所以在对分子进行筛选时,除上面两点之外,结构紧凑或体积小也是十分必要的,因为,从物理学角度看,体积小,受其他基团或分子随机攻击的机会就会低,其结构更稳定,活性更持久;从哲学或逻辑学的角度看,此类分子的合成和维持所需要能量的利用效率也是最高的.
囊泡状结构稳定是其延续的条件,而成分的相对恒定以及某一关键成分的相对稳定则是保持囊泡结构稳定的基础. 也就是说,囊泡状结构不是为了延续而生的,但成分相对恒定、结构相对稳定、活性相对专一与适度却是自然选择的结果,乃是一种自我审判与自我救赎.
上节对囊泡状结构内混合成分的合成反应的概况/原则进行了简单分析,下面专门分析囊泡状结构内DNA 与RNA 的合成问题.
同蛋白质及其他生物大分子的合成类似,在囊状结构内也会继续进行同非囊状体系中类似的DNA 合成过程,这种过程在理论上有以下三种形式.第一种合成方式:从头合成方式. 前提是存在某种磷酸水平(1 到3 个磷酸基团)的脱氧核苷酸[28]. 如前所述,在某种偶然的自然条件下,在“类生物酶”催化下形成了寡聚核苷酸链或长链,这是一种相对单调重复的过程. 或许当初的核苷酸的碱基不仅仅是现在所用到的4 种,即A、G、C、T. 但整体看,在形成无数种随机序列的单链之后,在超过一定长度之后若能回折后配对,如同现在所熟知的RNA 一样,就会互补而呈现发夹结构以及其他的三维结构形式.同时,由于寡聚核苷酸链或长链合成的高互补性,也会出现两条完全互补或近乎完全互补的两条类DNA 单链,从而使双链DNA 分子呈现线性,只是这种概率较低而已. 尽管如此,由于形成了稳定双链结构,相对而言比单链结构或由单链结构形成的其他立体结构(仍有很多单链区分布在立体结构的外部)有更高的稳定性或耐其他物理因素或生物因素降解的能力,也就是说,在一定环境条件下,这种双螺旋结构一旦产生,其滞留在溶液或囊泡中的时间可能还比较长,经过长时间的演化,某一种类DNA 积攒的量会愈来愈多(被动储存,属无意义反应). 最近的研究表明,采用腺苷酸的类似物1-氨基腺苷酸也可以参入到DNA 的合成中[29-31],这再次说明生物小分子和生物大分子及其催化剂一直是处于不断的筛选过程中,一定程度上反映了自然演化的本质.
第二种合成方式:从已合成的RNA 经过脱氧转化而来. RNA 合成的一种形式可以参考上述DNA 合成的方式,只是原料换成核糖核苷酸而已. RNA 链合成后,由于某种因素而导致核糖2’-羟基上的氧脱去,而使RNA 转变成DNA. 理论上,普通的化学因素很难保证这一高选择性的催化过程,这一过程很可能是在蛋白质或RNA 形成后,由生物催化来完成的.如若暂且不考虑何种因素导致了脱氧,那么所产生的DNA 结构与最终归宿同第一种方式所得DNA 的归宿是一样的.
第三种合成方式:基于某些单链RNA 作为模板而开启的DNA 合成(即现在所熟知的逆转录反应).在早期,很可能这种催化反应对嘧啶或嘌呤或其类似物的识别不是很严格,不管怎样,它开启了生命诞生史上的不同于其他生化反应的“基于模板”的反应模式,这或许是第一次具有里程碑意义的反应. 经过反应所形成的DNA/RNA 杂交链,因RNA 分子的活泼或因酶的特殊结构而最终解离,DNA 与互补链变成惰性双链. 解离后的RNA 参与其他的合成反应或降解反应. 综上,存在于DNA 或RNA 的碱基顺序在新的产物形成后得到了再次体现,这就是所谓的遗传,即从DNA 到DNA/RNA、从RNA 到DNA/RNA的反应在有模板存在时,所形成的后续分子具有天然的相似性.
紧接着的问题就是,一旦DNA 双链形成了,它存在的意义是什么?可否利用其作为模板来合成DNA 或RNA?理论上,在其合成后,若解链,同样可以作为模板以合成DNA 和RNA,但是,出现这种情况应该是在囊泡结构形成并经过长时间演化之后才可以进行的. 这主要是基于DNA 紧凑的双螺旋结构在自然条件下是比较难以被拆开的,即便是在某个环节打开了螺旋,但在连续的拆解过程中,行进的前方肯定愈来愈紧,无法完成稍长的DNA 拆解. 也就是说,DNA 一旦合成,基本上作为一种存储状态了(有点“刀枪入库,马放南山”的韵味).
综上,虽然我们现在认为DNA 是遗传物质,对生命延续起至关重要的作用,但我们也有理由推测,在生命诞生过程中,它其实是一种偶然产生的成分而已. 它的存在完全是一种被动的过程,而且在生命诞生的某个时期很可能会有较大量的积累(现在众多的重复DNA 或许就是对最初存在的随机的重复、单调的反应的佐证,而真正的基因组仅占约1%左右). 其原因就是,无论是上述何种产生机制,由于DNA 的惰性特征,其不会对当时存在的其他大分子的生存造成影响,而且由于其积累,因产物反馈抑制的普遍性,某种程度上被动性地降低了其合成过程,降低了对原料的消耗. 在囊泡状结构演化的后期,我们认为,具有遗传意义上的DNA 的来源以来自于RNA的“逆转录”方式为主. 该过程实质上也是RNA 的主动筛选过程,在某种情况下会使RNA 的产生、分解维持一个相对的平衡,其中RNA、原料脱氧核糖核苷酸、基于RNA 产生的蛋白质以及二者的聚集体在维持RNA、蛋白质、DNA 等大分子的量的相对平衡中起关键作用. 当然,这一长期筛选过程的化学基础就是肽键以及基于氨基酸成分所形成空间结构的稳定性和分解能力的适中性以及特异性.
由此,文中推演出一个观点即:早期的DNA 可以形象地称作是RNA 的“备胎”或“备份”.
关于RNA 起源过程的分析. 尽管RNA 的合成最早应该是非生物合成,但进入囊泡状结构时期,则演变为基于蛋白质或RNA 或蛋白质-RNA 复合物催化的合成方式为主. 逻辑上与DNA 合成的方式类似,主要有三种:一是从头合成方式;二是基于已有的偶然存在的单链RNA 为模板并借助特殊蛋白质或RNA 或蛋白质-RNA 复合物催化的合成,类似于现在的依赖于的RNA 的RNA 复制过程;三是基于已存在的某些DNA 并借助特定酶(逐渐演化成现在的依赖于DNA 的RNA 聚合酶)的合成方式. 从逻辑上看,第三种方式的出现是最迟的,但从现在的视角看这种方式也是最有意义的;这种方式尤其是在RNA具有相对稳定的一级结构及二级结构、三级结构并具有相对稳定的反应功能(包括催化反应)的条件下,有利于体系成分与结构的稳定,同相应功能的类蛋白质一样,二者共同促使了生命的启蒙. 关于上述三种RNA 的详细合成方式的分析,此处不再赘述.
生命早期进行的DNA 与RNA 的合成多是基于一种随机反应,反应速度快慢及是否终止多取决于原料的多寡,这一点是不同于生命细胞时期,后者多是基于功能所需. 在生命细胞阶段,与上述的多次反复反应不同,遗传信息存储与遗传呈现单次性特征,这一点是受原料所限还是其他因素所致,值得探讨.
关于RNA 与DNA 起源先后的分析. 前已述及,目前研究人员已基本认可RNA 起源早于DNA[18-19,32],下面用逻辑学分析方法推演该结论的合理性. 按照生物大分子产生的条件及现有的模拟实验结果,由于最先产生了核糖,也就顺便推演出相应的核苷酸和寡聚体即RNA 的先后顺序,当然这只是一种最直观的逻辑分析. 那么其背后蕴含的科学问题到底是什么?或者说有无存在可质疑之处?我们认为在小分子核糖产生后,在无机条件下,如若有意识地脱去一个氧原子,从现在我们对有机化学反应的认知来看,有比较大的难度,但若从生物酶学的角度分析,催化这一反应是一件相对简单的事情,正如普通的有机反应,在有手性碳存在时均是产生消旋物,而不是单一的左旋或右旋单体. 因此,从逻辑上,很可能先形成核糖,然后脱去氧而形成脱氧核糖,从而参与核苷酸的形成;那么是否是先形成核糖核苷酸,然后再形成脱氧核糖核苷酸?从逻辑上看,这种概率也是很高的. 但无论何种情况,这两种过程都应该是基于有一定特异性的蛋白质或RNA 或二者的复合体形成之后才会发生的. 也就是说,从逻辑上,与遗传信息传递有关的DNA 的合成很可能晚于RNA 的合成. 因此,虽然该推测与基于核酶发现的推测所得出的结论一样,但两者的论据有一定区别. 因RNA 的核糖C-2’上有游离-OH 存在,使得C-2’呈现一定的诱电子效应(亲核反应),即便于氢氧根的亲核攻击,所以RNA 易被碱水解;当然,RNA 分子也会因此而变得相对活泼. DNA 上的核糖的C-2’上因没有-OH 而不易被水解,而且整个分子显示较强的惰性. DNA的这一惰性在涉及到DNA 的相关反应中,在调节相关体系的化学平衡方面发挥了重要作用,以至于发展成为遗传信息的备用库即上面提到的作为RNA的备份.
第一个作为可携带遗传信息的天然聚合物是一个有争议的话题[33]. RNA 世界理论认为RNA 是第一个可复制的信息载体[34-35],但是也有一些证据表明,生命或起始于包括RNA 和DNA 在内的遗传体系.由于组成RNA 和DNA 两种成分的构建组件有一定的相似性,二者起源相近符合化学逻辑,这就要求两种合成组件应有某种相似或相近的合成路径;为此相关研究也给出了一些进展. 模拟生命前的地球化学条件能够合成组成RNA 的胞嘧啶核苷、尿嘧啶核苷及二者的二硫基衍生物[36-37],在此基础上又以嘧啶核苷为原料在非生命系统中合成出尿嘧啶、胞嘧啶及可用于合成DNA 原料的脱氧腺苷等[28],由此实现了DNA 与RNA 组成元件的转换,似乎表明组成两种大分子的嘌呤脱氧核苷与嘧啶核苷在生命诞生之前或许是共存的[38],由此也注解了两种大分子成分在起源时间上的相近性. 实际上,考虑到早期化学反应的随机性,作为反应产物的DNA 或RNA 的合成时间或许相差不大,但作为自然选择的结果,真正作为遗传物质载体的RNA 的合成应该早于DNA 的合成.
需要说明的是,一旦开启了DNA 的合成,会影响到前期对相关原料的合成,同时也是对起催化作用的蛋白质或RNA 或二者的聚合物有一定的筛选作用,即它所催化的反应对体系的破坏作用不大,使得整个反应体系是相对稳定的. 这是从DNA 形成的角度来分析该过程对“催化剂”的筛选. 同样,在囊泡体系中也同样对RNA 合成的“催化剂”有着同样的筛选作用.
在对囊泡状结构中DNA 及RNA 合成进行分析的基础上,下面简要分析与此过程有密切关联的病毒的起源问题. 目前已经很清楚,病毒是一种必须依靠宿主细胞才能生存并繁殖的生命形态. 从其组成及结构看,其主要有富含特异蛋白配体的脂双层及内部所包含的遗传物质组成,遗传物质有单、双链RNA、单、双链DNA 等多种形式[39],而且在病毒内是比较“干净”的即不包含任何细胞器等颗粒状成分,仅含有相关的复制酶及重组/插入宿主基因组的酶. 从病毒的整体结构上看,它也是比较简单的. 由此,在逻辑上,这种情形可以比较自然地与上述囊泡状结构相联系,即在某种情况下,囊泡状结构中原来的诸多的化学反应逐渐消失,经过长期演化,仅保存了能够使当时现有的RNA 或DNA 形成的酶. 显然,这种酶是经过无数次的筛选而来,所以活性应该很强,同时也很专一,这也就解释了为什么现在的病毒对细胞有如此高的黏附与侵染能力. 因此,基于上述分析,我们有理由推测,病毒是与细胞共同起源的,而不是由进化出的原核细胞逐渐退化而来. 进一步深入剖析可知,逐渐演化成病毒与逐渐演化出原核细胞的两种囊泡状结构在演化过程中,也会发生某种程度的相互作用尤其是基于膜表面蛋白的相互作用显得异常重要,对膜表面相互作用的蛋白及对应的基因进行分析,有望发现其保守结构或保守序列.
此处简要介绍目前关于病毒起源的两个模型.由于缺乏最基本的化石,自上世纪20 年代首次发现病毒以来,关于病毒起源的描述一直处于假说状态.对于植物病毒来说,其假说主要有两个,即细胞先生模型(cell-first model)和病毒先生模型(virus-first model),前者认为病毒由细胞退变而来,后者则认为病毒早于真正的细胞生命状态/形式,而且多数生物学家认为RNA 单链病毒早于其他形式的病毒. 总的来说,由于缺乏必要的基础信息,无论何种模型或假说都有其合理性和不足[40]. 那么,何种病毒最为古老呢?根据上文对囊泡状结构以及生命物质产生的最初状态的分析,我们认为,虽然RNA 的产生很可能早于DNA,但这并不能由此推测RNA 病毒一定早于DNA 病毒,这是因为病毒的产生起源于囊泡,而此时RNA、DNA 均已经产生甚至与RNA 相关的蛋白质的合成路径已经开启,所以无法推测二者产生的先后,也就是说DNA 病毒与RNA 病毒两种病毒很可能是同时产生的,更准确的描述应该是在同一时期产生的. 接着分析单链、双链核酸病毒产生的先后问题. 从分子稳定性上看,由于双链分子比单链分子更稳定些,这反而说明单链核酸病毒很可能早于双链核酸病毒,否则,在长期演化过程中它也不会被保留下来.
20 世纪50 年代末克里克提出的“中心法则”假说比较好的阐述生物体中遗传信息传递的方向和过程. 尽管一些发生在生命体之间信息传递的个别案例如曾获得1997 年诺贝尔化学奖的朊病毒(prion)的发现、普遍存在的真核生物表观遗传(epigenetic)的现象等不能与所熟知的中心法则核心内容相吻合,但整体上看,此后经过数十年的修正和发展,中心法则还是能对生命体内的信息传递有一个相当完整的解释[41-43]. 下文对最初的遗传关系,我们称之为弱遗传关系或非典型遗传关系的形成过程进行分析.
经过数以亿年计的时间延续,尤其是存在于囊泡状结构内的多种无序化的化学反应之间逐渐相对平衡(注意:这一点是文中的核心基础之一). 前面提到的以前二种方式所合成的DNA 可以称作是游离的或独立的DNA,其不与遗传相关联,合成后即以惰性形式储存起来;而第三种合成方式即以具有相对活性的RNA 在“逆转录酶”作用下,不但逆转录出DNA(+),而且通过复制还产生RNA(-),后者也可以逆转录产生DNA(-) ,此时DNA(+)与DNA(-)互补成惰性的双螺旋DNA,以调节上面的提到的系列反应,进而维持包括DNA 在内的终产物的量与进入囊泡内的原料量之间的平衡,某种情况下也是在筛选原料的获取方式. 作为一种常规反应,DNA 因积累或因原料的过度消耗而反馈至其合成过程,从而使合成过程降速或以极低速进行. 而游离出的RNA(+)、RNA(-)或以短时双螺旋结构存在,因其多以一定的三维结构形式存在及其固有的高活泼性,从而启动相关的降解或合成反应. 在其量被动性减少或活性降低后,作为代偿,体系内的双链DNA 便在特定的蛋白质或RNA 或二者的复合物作用下,使之解链并合成出相应的RNA,此即为早期遗传信息从DNA到RNA 的雏形(见图1). 而且,对于上述相对惰性的双链DNA,无论是以何种方式形成的,在随机或多种条件碰巧耦合的情况下,双链总会在特殊部位打开并开启基于蛋白质或RNA 或蛋白质-RNA 复合物(也就是现在所说的依赖于DNA 的DNA 聚合酶)的“酶”促合成,形成新的与已有DNA 相似的新DNA,即所谓的复制. 现在的研究结果对此给予了很好的注解,如DNA 在进行活性展示时即复制或转录时,在其特定的位点解开紧密结合的双链,很显然都不是通过其产物来启动其活性,出现这种情况是符合逻辑的,因此通过其他分子,再结合其自身结构的因素是合理的,这就是在转录的起始点富含使其结构不稳定的碱基组成(如TATA box)、在复制起始点富含A-T 碱基对、诸多蛋白因子参与复制或转录的起始. 由于DNA 的惰性,使得其合成过程或因反馈调节而呈现非积极/非活泼状态.
图1 遗传信息从(起源于RNA 的)DNA 到RNA 的进化示意图Fig. 1 Diagrammatic sketch of evolution of genetic information from DNA(originated from RNA) to RNA
前面介绍了囊泡状结构内RNA 的产生过程也就是遗传信息从DNA 传递到RNA 的过程,那么遗传信息是如何传递到蛋白质的呢?对这个问题的回答实际上也是解决了密码子形成的机制问题. 在理论上,早期众多的RNA 为什么要逐渐演变成以mRNA、rRNA、tRNA 为主的状态?理解这个问题,必须要从囊泡内有可能存在的蛋白质的合成谈起,而且这个过程在理论是也会涉及到RNA 的参与. 尽管近20 年来,关于小RNA 的研究进展已经极大地改变了我们对RNA 的认识,但这并不能否认上述几种RNA 在真正体现生命现象中的核心作用. 下面先从“生命选择类tRNA 作为氨基酸聚合成肽的载体”谈起.
前已提及,囊泡状结构的稳定与其中成分的相对恒定有密切关系,其中上文已经分析过DNA 及RNA 的恒定问题,那么如何保持众多蛋白质的相对稳定呢?
很显然,借助天然的物理极端条件很难使游离的小分子成分按既定的顺序连接,因为这个过程需要有一个足够长的将单体聚合的模板,而且还要求模板本身或有其他第三方能够识别不同的氨基酸的能力. 很明显,最直接的思路就是如果在一个相当大或相当长的聚集体上面或内部有一个可识别、安放、连接(聚合)不同氨基酸的沟槽或通道(即所谓的“长车间(含既定模板)”样结构)的话,即可实现有序组装,也就是说这一装置必须具有数十个至数百个活性位点,它不但能识别不同大小、不同极性的氨基酸,而且还要识别每一个氨基酸的两个重要端点(即氨基端和羧基端). 显然,这种机制对“长车间”本身有极高的要求,由于大分子结构的复杂性、多变性,通过随机的方法是很难保证这一装置的持续合成与稳定,通俗地讲,“长车间”模型是不可行的. 因此,退而求其次必须有某种体积比“长车间”小、广谱性的可识别、存放、撮合氨基酸之间聚合的机构,该机构重点集中在可高效识别氨基酸的氨基和羧基,但对其他相关的基团有足够大的宽容性,同时在进行相对准确的识别氨基酸时还需要保持自身结构、性能的稳定. 当然,长的“存放”氨基酸顺序的模板仍是必须的.
由此,一个可移动的兼具识别不同氨基酸的装置/工厂(本质就是高分子聚集体)是比较理想的,且该装置同时还需具备识别某种氨基酸顺序模板的特性;此处包含特定氨基酸顺序/信息的模板不但足够长,而且存放氨基酸的空间也必须相对稳定. 很显然,由于天然的大分子的柔性、形成过程的随机性是很难长期持久地产生并维持这一比较长的沟槽结构即模板,也就是说,逻辑上刚性的长模板也是不可能存在的,因此,最后的选择恐怕仅余下“刚性”装置与“柔性”模板相关联的选项了,这在本质上就是建立柔性RNA 与“刚性”蛋白质合成装置之间的关系,而且在生命起始的早期,蛋白质和RNA 这两种成分在形成空间结构后又有某种相似性、可互补性.
RNA 类成分参与蛋白质的合成既属偶然或巧合,亦属必然. 如前所述,在生命早期,由于地球早期环境条件产生了各种简单小分子成分,进而产生了很多大小不同、结构不同及活性有别的RNA 等中型分子. 由于体系处于混沌状态,在蛋白质或RNA 或蛋白质-RNA 复合物的作用下形成了类氨酰RNA、类氨酰DNA 等稍微复杂的杂聚体(注意:也包括现在所说的类氨酰tRNA). 理论上,这类分子量较大的化合物中就某一个分子而言,其存在的时间很可能要比其原料氨基酸、RNA 等初始成分产生并持续的时间要长些[44]. 因为后者很可能在极端条件下比较容易地形成一些“无所事事”的随机聚合物类成分,而前者,本身已经作为大分子或中型分子了,加上氨基酸或其他小分子后,在本质上并不能改变RNA 本身的结构与性质. 由于RNA 自身折叠所形成的空间结构的特性,使得同种RNA 之间及不同RNA 之间经常发生诸多无意义的互补,分子内、分子间经常出现诸多短的或较长的互补区,在超过5-6 个碱基对或更长时,便会出现双螺旋结构. 当然,这个结构在当时的生物学意义并不大,只是增加了RNA 类成分的稳定性而已. 需要特别提醒的是,对于大分子而言,稳定性大、寿命长,对其自身无意义,尽管存活周期延长了,也就是多保持一定时间而已,但这一对自身无价值的性质却是生命积累与演化的基础. 分子稳定性强,说明其当时的结构抗物理性、化学性、生物学分解的能力强,尤其是抗酶降解的能力强,RNA的这种性能直接影响到基于其结构所产生的互补RNA 的生存时间与存在价值,有较大积累的可能. 其所“辐射”或衍生的内容就是以此为模板所形成的DNA 的状态. 同理,若是借助物理方式形成脱氧核糖核酸(单链),之后再进行随机合成DNA 单链又碰巧合成对应的/互补的单链,最后所导致的双链,其越稳定,对自身生存越有价值,但对于生命的演化来说,越无价值. 因为,生命活动一定要动起来. 随着时间的持续,奇迹出现了,即与类mRNA 结合的两种氨酰-tRNA 在蛋白质-RNA 复合体的帮助下形成了二肽,进而形成了多肽,或许分子量很小,而且在其他途径中也早已合成,但意义重大,这是生命诞生初期又一个里程碑式的反应(图2),我们将这一过程归纳为“柔-刚对接模型”. 此过程是第一次借助于模板和其他生物大分子合成出多肽/蛋白质成分,从概率上,最初时几率很低. 尽管在此之前已经可以基于RNA模板,在蛋白质或RNA 或二者聚合物的帮助下合成了相同的RNA,但这毕竟是两个核苷酸小分子与模板结合后,空间上相距很近的机会是很大或者说是必然的,此时反应可否持续的关键是有高活性的、稳定的可使两种核苷酸撮合出磷酸二酯键的蛋白质或RNA 或二者的复合物存在,而对于这一复合物,总的来说,其产生的概率还是很高的,因为二者太容易形成相对稳定的空间结构且富含活性基团.
图2 遗传信息从RNA 到蛋白质的进化与筛选(“柔-刚对接模型”)示意图Fig. 2 Diagrammatic sketch of evolution and screening of genetic information from RNA to protein (“Model of Soft-Hard Butt-joint”)
关于蛋白质或多肽合成时tRNA 的选择性:在基于RNA 之间相互作用进行蛋白质合成的偶发过程中,不仅仅是两种类氨酰-tRNA 的氨基酸相距很近,而且二者在类mRNA 上有相对固定的位置(不一定是紧邻),或者说二者的相对位置要固定;同时,如果类似成分具有相对稳定结构的话,由于起撮合(催化作用)的复合物的结构是相对固定的,因此从空间上也对类氨酰-tRNA 成分有一个最基本的筛选工作,必须保证既要与mRNA 有适度的相互作用,而且还要使所携带的氨基酸之间相距很近,逐步演化的结果是类似RNA 结构组分参与蛋白质合成愈来愈多,最终使得这一类有特定结构的RNA(不一定是现在所看到的三叶草形结构)得以保留,结构明显不能被聚合物所识别的其他氨酰-tRNA 便被积累,某种程度上也反馈到其合成过程/反应逐渐被淘汰. 所以,对tRNA 在大小、结构等方面的选择在本质上就是自然选择的一种方式. 上述类核糖体与类氨酰-tRNA的相互筛选过程某种程度上与Lewontin RC 曾说过的“对生物进化最好的理解是, 它是一部对于压力不断探寻迂回通道的历史(Evolution is best viewed as a history of organisms finding devious routs around constraints)”有同工异曲之妙[45].
在类氨酰-tRNA 与类mRNA 相互作用过程中,另外一个问题也是非常重要的,那就是到底需要多大的作用力. 理解这个问题,我们不能从蛋白质合成的目的看,因为,二者的相互作用只是众多反应中的一个,这种相互作用本源就不是为蛋白质合成而生的,而是其有相互作用(互补)的内在基础. 在两种RNA(类氨酰tRNA-类mRNA)相互作用这一随机过程中,需要在数学逻辑、化学逻辑上都要兼顾. 若仅从化学逻辑上分析,很明显,配对的碱基对愈多,作用力愈强,尤其是若能超过6 bp 甚至超过10 bp,即可形成半个螺旋甚至一个完整螺旋,其结合力是相当稳定的. 但是,若从概率的角度考虑,连续且完全匹配时,上述的概率分别是1/46(即1/4 096)、1/410(即1/106),也就是说,对于某一给定mRNA,在其他随机选择的RNA 中,能够实现连续多个碱基完全互补的概率是极低的. 故,从概率上考虑,通过1 bp-4 bp 发生作用对类氨酰tRNA 进行暂时性“固定”的概率分别是1/4、1/42、1/43、1/44. 若取一长度为1 500 nt(相当于冈崎片段的大小)的RNA 为例,其中包含的作用位点分别是375 个、96 个、24 个和6 个,也就是说当tRNA 足够长时,局部有3 个甚至4 个连续的碱基完全互补的机会还是比较大的. 若是以目前所熟知的tRNA 的大小为80nt 计算的话,理论上其包含的高亲和力(碱基互补)位点分别是20、5、1、0.31,也就是说,一个现在的普通tRNA 按随机组合的话仅有一个三联体的序列完全互补,这或许是一种巧合. 如若考虑类tRNA 与类mRNA 结合的目的,作为载体既要有一定的结合力又要保持比较容易解离,那么直观上看,靠一个位点结合,虽然容易结合,但粘附力太小、易解离;若通过5-10 bp 相结合,则对小分子tRNA 来说,出现完全互补的概率又是很低的且结合力又太大,不易解离,所以依靠2-4 个bp 结合,无论是从概率上看,还是从结合力的大小看都是比较适中的. 从键能上看,若每个bp 按2.5 氢键计算,则破坏每个bp 需要大约30-40 kJ/mol 的能量,约相当于1 个ATP 的自由能;按现在的密码子与反密码子配对情况看,破坏这一暂时的复合物需要3 个ATP. 我们将这一数据与现有的生化反应过程对ATP 消耗情况进行简要对比,单步消耗1 个ATP 的反应最为常见,单步消耗2 个ATP 的反应占比很低,尚未有单步消耗3 个ATP 的反应. 也就是说,类氨酰-tRNA 与类mRNA 的结合,无论是依靠2 bp 还是依靠3 bp,都是相当稳定的. 目前,国内外的教材或教师授课过程中,在涉及到密码子中碱基的数量即关于4 种核苷酸与氨基酸的线性关系时,常用数学上的排列与组合的知识进行解读,43=64,即3 个连续核苷酸所形成的64 种碱基组合即可完全满足20 种氨基酸的需求. 我们认为,这种解释貌似合理,实则有点牵强. 用3 个碱基配对所形成的暂时复合物的稳定性进行解释更合理些,毕竟生物分子间反应的过程不会完全遵循数学上的逻辑而是多取决于化学逻辑. 因此,之所以出现上述4 种碱基中的3 个/种决定1 个密码子,只是巧合而已.
上文是从概率和化学角度分析类多肽/类蛋白质合成过程中类tRNA 与类mRNA 之间碱基配对时所可能存在的比例关系,这实质上也反应了氨基酸与核苷酸之间的比例关系,也就是现在所熟知的密码子的构成. 关于遗传密码的起源或者说蛋白质的氨基酸顺序与RNA 的核苷酸序列之间的关系,影响比较大的就是很早以前克里克提出的“偶然冻结”假说,他认为密码子与其对应的氨基酸之间没有必然的化学联系而是一种随机[46-47]. 从我们现在对生命起源的认识看,早期密码子和氨基酸之间的呼应关系确实是随机的,但是随着氨基酸、类氨酰-tRNA、类核糖体等分子之间的相互筛选,参与形成蛋白质的氨基酸的种类愈来愈少,便呈现了密码子的简并性、摆动性等特征. 当然,密码子的第3 位核苷酸与反密码子的第1 位核苷酸之间采用非严格或标准意义上的互补配对即摆动性[47],文中认为,这在一定程度上也是柔性mRNA 与具有一定三维结构但又很难保证参与配对的类氨酰tRNA 的局部较长的线性结构所采取的“宽容”策略.
与以前的借助随机反应产生的多肽/蛋白质的性质类似,若基于类mRNA 模板参与下合成的蛋白质具有一定结构且惰性的话,它就可以较长时间保存,至少不能对现有结构有强破坏能力的成分存在,这其实也是演化的逻辑,即新产生的蛋白质、RNA 等须有一定的催化活性但又不会对现有成分有强的分解能力.
同样,那些能够参与到蛋白质合成的其他RNA因与蛋白质有较好的互补性能和自身惰性,所以得以保存,这类成分(即现在的rRNA)应该以催化和结构性成分(物理性支持)为主. 现在的rRNA 参与蛋白质合成也是以其结构为基础的,类tRNA 与类mRNA相互作用过程是依赖碱基互补,而RNA-蛋白质聚合物恰巧有多余的单链部分存在,对类mRNA、类tRNA的暂时固定起到天然性作用,也就是说,本来仅起催化作用,此时又顺便起到固定底物的作用(相当于现在所说的定向催化),无意间使反应的效率大大提高. 该聚合物/复合体也逐渐演化成专门的合成蛋白质的结构也就是目前所熟知的核糖体. 至于类rRNA仍保留酶促活性应属其天然属性所致,抑或是肽基转移时,因蛋白质与RNA 复合物的局部空间太小,在存放两个氨酰-tRNA 之后实在无充足的空间以满足既要提供活泼基团又要满足对活泼基团的物理支撑所致,亦可以理解为“迫不得已”. 作为整个体系的“支撑物”组成,其多少或大小实际上可以有较大的弹性,这也就是核糖体保持大体量冗余的一种形式.
上文内容可简要归纳为:在生命诞生早期众多的分子中,存在无数的结构迥异的RNA 及借助非生命反应或非“典型酶”促特异性反应形成的类氨酰-RNA,由于类氨酰-RNA 和来自于非典型生命合成(非酶促合成和非特异性蛋白酶促合成)的RNA 及上述基于DNA 产生的RNA 之间有天然的互补关系,因此在经过长时间的无数次巧合与无数次筛选反应后,便形成了与游离氨基酸在非特异性酶催化或无机催化下合成的蛋白类成分相似的蛋白质,此时无论何种蛋白质,其三维结构的相对紧凑和整体结构的相对稳定是其存在的基础,换句话说,由于非模板反应的随机性以及来自于模板反应且在结构上相对紧凑和稳定,使得两类蛋白逐渐演化出不同的命运,前者的含量和种类愈来愈少,最后消亡;来自于后者中的一部分具有稳定结构及适中的合成或降解活性则得以持续合成与保留,由此便建立了基于囊泡中现存的随机RNA 指导的蛋白质合成路线,进而体现了从RNA 中碱基顺序到氨基酸聚合体(也就是现在所说的蛋白质)的逻辑图,在此过程中,经过长期的演化与选择,以RNA 和蛋白质为主的聚合物(也就是现在所称作的核糖体的前身)也就脱颖而出. 由此可知,由于蛋白质、蛋白质-RNA 聚集体、RNA、DNA 自身结构中具有相对惰性、稳定、互补等特征,在无数DNA→RNA→蛋白质代谢路径中,经过长期进化,仅保留具有功能/性质相对稳定的少数,这就是现存的细胞基因组中的基因和对应的蛋白质. 由此,也就在囊泡状结构内建立了从DNA→RNA→蛋白质的弱遗传关系的雏形(图2). 实际上,在非开放体系中也会存在上述弱遗传关系,只是发生反应的概率较低或受干扰因素的影响较大而已.
对“RNA 世界(RNA world)”的再思考. 如上所述,RNA 在蛋白质合成中发挥了举足轻重的作用. 实际上,国外学者奥吉尔(L. E. Orgel)于1967 年提出RNA是地球上最早出现的遗传材料,而DNA 和蛋白质则是进化的产物,该思想也同时被著名学者克里克和微生物学家沃斯(C. Woese)提出,这就是著名的“RNA世界(RNA world)”假说[48].
目前,生物学家普遍认为进化需要三个过程:1)产生一个多样化的种群;2)根据某种适合度标准选择成员;3)繁殖以富集这些更适合的成员. 若从现在我们所了解的情况看,RNA 分子恰好能够在适宜的条件下在体外进行这三种过程,似乎帮助我们窥见在生命早期进化过程中混合体系内的RNA 的独特意义[27],为此有学者提出“RNA 起源早于蛋白质且在生物遗传和催化中扮演主要角色”,同时用组合化学的方法进行了实验模拟:譬如,能否创造一个能够结合ATP 的RNA 分子以模拟进化之初这类大分子首先与ATP 发生关联. 研究人员在实验室中通过组合化学的过程来随机合成多种多样的RNA 分子(远超1014种),最后经过亲和层系得到了16 种能够结合ATP 的RNA 分子,特异性和结合强度都很高(解离平衡常数小于50 μmol/L. 该值远低于胞内ATP的通常水平),从而很直观的验证了上述设想[27]. 但是,若从实验对象来审视这一实验及推论时,我们发现该实验是在分子层面进行的,首先产生了种类庞大的群体,而其参照的标准则是完整的生命体,两者之间有一定区别. 相反,这个实验正好说明,在生命起源密切关联的早期随机反应中,总能出现一些具有某种特定结构与功能的生物大分子,而业已清楚生物大分子是生命所必须的,其产生的概率尽管低,却也是自然选择的结果.
如上所述,尽管组合化学可以产生具有特定功能的生物大分子,但我们认为该结果尚不足以证明“RNA 起源早于蛋白质”这一观点. 当我们以现代生命科学的视角审视当时的生命时,我们认为生命的产生和延续的基础是由大分子聚集所导致的结构化、有序化,以及基于大分子的反应的可持续性. 前者是基础,后者可使结构动起来、活起来(就是现在所说的基于各种酶催化活性的一系列代谢反应),因此,大分子的结构稳定性是基础,也是关键. 根据这一理念,就认为生物大分子的合成、存在方式必须按照特定的或既定的方式进行,这样才能向着逐渐结构化、功能逐渐单一化等方面演化,才能导致生命的诞生.很显然,这种思维方式就有点像射击比赛中,箭头射到靶上后(不一定是靶心位置),再以箭头为中心,画靶环并定义箭的运行轨迹. 显然,这种思路是不符合逻辑的. 因此,早期反复的生化反应之所以能够演化出生命现象,本质上是在筛选/寻找一种可长期维持这一系统的方式而已.
从上文对DNA、RNA 以及蛋白质合成的分析可知,不是先有RNA,后有蛋白质,而是二者很可能是同时期产生的. 那么能否藉此对“先有鸡还是先有蛋?”的悖论进行解释?答案是否定的. 理论上,RNA与蛋白质的关系是在分子层面,而“鸡-蛋”疑问是生命演化后期的事件. 关于“鸡-蛋”之论,我们希望以后另文专门讨论这一既包含生物学的原理,亦包含有哲学方面的思维问题.
在上文提出的弱遗传关系建立时,并未特别强调是基于生命或细胞内发生有关联顺序的一系列反应. 按照我们现在对生命现象中中心法则的理解,弱遗传关系应该是基于细胞或类生命的. 但从最初的基于化学、化学反应平衡等假设看,这种弱遗传关系所涉及到的几个反应或许在非囊泡状结构或开放体系中也有可能随机发生,只是在囊泡状中更有规律而已,也就是说,这种弱遗传关系的建立最早应该是基于无生命或无真正细胞的时期或状态,这是因为,若先假设是在细胞或类细胞中建立的,就已经承认或间接承认是弱的遗传关系导致了生命的存在和延续. 所以,我们提出弱遗传关系的建立是基于无生命或无真正的细胞体系. 理论上,在无生命或无真正细胞体系中,发生反应的随机性和偶然性是极大的,而且多是关联反应,因为新的产物产生后,就有可能启动新的反应. 由此可以推论出,弱遗传关系的建立是众多关联反应中的一组而已,只是反应过程需要模板罢了. 当然,即便是在非典型的生命延续过程(注:典型的生命延续过程就是现在的原核细胞的比较均等的细胞分裂)中,弱遗传关系的产生也是必然的.
一旦囊泡或类细胞中弱遗传关系得以建立,就表明诸多相关的反应达到某种默契或平衡,随着时间的延续,这种关系更加趋于稳固. 经过长期的演化与进化,最终形成了现在所熟知的中心法则. 这个过程不但使类细胞或细胞(原核细胞)的结构更加优化和简化,而且作为一种调控诸多反应的“酶”的产生也更加有序,真正的遗传关系便顺势确立. 从中也可以推论出,生物进化过程看似保证一些分子结构的进化,实际上分子结构的改变源于功能所需,即存在是第一位的!
上述分析尽管是对遗传有关的中心法则的逻辑分析,实际上这种思路也是我们对生命的雏形-原核细胞最初演化成果的理解. 综上,对原核细胞中中心法则建立过程的逻辑或原核细胞的诞生过程可以归纳为图3 所示.
图3 基于原始大气成分、地球演化的原核细胞产生的逻辑图Fig. 3 Logic sketch of origin of Prokaryote based the component and earth evolution
前文对生命产生过程有可能存在的主要环节进行了推理和分析,其中涉及的主要逻辑归纳起来主要包括地球演化的自然逻辑、生物小分子产生的化学逻辑以及生物大分子产生并呈现生命端倪的生物学逻辑,其中地球的演化尤其是温度颤变至适合生命物质诞生和结构稳定的范围内为生命的起源奠定了最重要环境条件. 下面予以简要归纳.
①根据我们对自然界最朴素的看法,世界是物质的、客观的,物质是运动的,运动有其自身规律,由此,我们完全接受根据现有的技术对地球早期状态的描述,这种描述尽管不太精准且具有很大的推测性,但存在的客观性、运动性等仍具极大的参考价值. 由此也就推演出生命是由无生命的分子逐渐演化而来的这一朴素的唯物史观.
②早期大气成分的多样性且具还原性与地球从极端条件突降或逐渐演变成平和,这是生命现象产生的前提和基础,两个条件缺一不可. 实际上,即便是早期地球成分没有完全满足米勒实验的条件要求,在后期极端条件的剧变过程中也有可能逐渐产生相应的还原性气体成分,最终导致有机小分子的合成与演化.
如刚刚所提及的现有的关于地球早期状态的知识表明,如高温、高压、强辐射等物理条件以及富含H2、NH3等还原性气体的化学条件等,由于这种极端环境持续时间长、强度剧烈,其必然会促使各成分间发生随机反应,而且在成键时会遵循同现在一样的成键规则,各种反应充满着巨大的不确定性,同时对于单一反应也有各自的化学平衡并遵循化学平衡理论;这些化学反应受条件的影响而充满着必然性,同时也充满着随机性/偶然性;整个开放系统也有一个相对平衡,即最简单的原料的消耗速度和最终耐分解产物的积累速度保持相对平稳. 整体上,生物小分子的产生过程遵循下列基础:
①早期化学反应的必然性及随机性/偶然性[50];
②化学平衡理论的普适性;
③成键规则-古亦循之;
④促使化学反应以物理因素为主(尤其是生命诞生的早期阶段),但也有大的不确定性(如强度、时间、分布等),且是非进化的,反应属非特异性反应(反应条件相对极端,导致的反应很可能仅仅受反应物的影响,即受控性差).
①基于生物分子的生物大分子产生的不可避免性而且其种类、结构必定多样化;
②生物大分子三维结构的形成、化学活性存在的必然性(这是由大分子内在结构所决定的);“酶”催化依赖于三维结构及活性基团的存在,反应有一定的可控性;
③生物分子形成的可持续性、可进化性、反应有特异性-结果有选择性,既是进化的结果,也是进化的原因;
④囊泡状结构产生的必然性(水的极性与磷脂的两亲性等).
综上所述,生命产生的逻辑可简要概括为:在生命早期借助非生命的催化过程产生种类庞杂的生物小分子类成分并进而产生了类蛋白质、多糖类、RNA 类,抑或包括DNA 类等成分,同时亦产生两亲性脂类成分并伴随着地球温度的冷却至现在的温度波动范围内,由内在属性而自发聚合成囊泡状结构,里面包裹了上述大分子、单体、衍生物等亲水性成分及丰富的水,并开启无数的基于蛋白质或RNA 或蛋白质-RNA 复合物为催化作用的化学反应.
在生命早期的类囊泡状结构时期或许存在众多的借助无数的RNA 模板合成的DNA,当然,也存在无数由RNA 作为模板所合成的活性不同的蛋白质.经过长时间的演化,受限于对活性蛋白质和活性RNA 的选择作用,仅保留了部分对整体化学反应平衡有稳定作用的蛋白质、RNA;基于模板反应,建立了依赖于DNA 的RNA 合成方式,基于“柔-刚对接模型”建立了依赖于氨酰-tRNA 与mRNA 相互作用的同种蛋白质的合成机制,初步形成了遗传信息传递的中心法则,最后也就确定了囊泡状结构中的DNA 种类. 具有单条染色体的原核生物(如最古老的细菌、衣原体等)之所以能完整生存,既有由多个短的具有某种功用的染色体经过拼接(重组)所致,亦有本来就是无数个长DNA 版本中的一个,而这一个染色体恰巧拥有满足一个囊泡结构中无数反应平衡的全部DNA. 即便是短DNA 的整合,也是随机的、偶然的,长时间的筛选最终演化出一个确保囊泡结构平衡的DNA. 现在多条DNA、众多重复序列存在于某一种细胞的现象,也正好说明了早期反应的随机性、单调重复性.
通常情况下,我们谈到科学,首先想到的是实验,但《逻辑研究》(Logische Unter Suchungen)的作者胡塞尔却不这样认为,他认为科学的本质不是实验,而是论证[51]. 由此可见,不论科学的本质是实验还是论证,逻辑学跟科学之间必然存在十分密切的关系,逻辑学的可能性就是科学的可能性. 回到文中,囿于化石原料因年代太过久远而造成的永久性缺失以及很难较准确还原当时的自然条件,故不能在实验室或试管中来完全模拟生命进化的全过程甚至个别细节,文中基于现有诸多认知,提出了对46 亿年前的地球现状、化学、化学反应等理解,并籍此提出了由随机反应及偶然反应推演出生物小分子及生物大分子的形成、类细胞结构的出现及基于类细胞结构的诸多偶然及随机反应导致类生命现象、弱的遗传关系的建立,进而建立真正的遗传关系并导致真正生命体的出现,这是一种利用逻辑知识和现有的化学、生命科学等知识来推演生命起源的尝试或思路. 当然,利用现代高运行速度和高运算能力的计算机技术并结合已获取的生物信息学资料对生命起源的过程进行模拟也是一种很好的选择[52-53]. 此外,组合化学作为一种可在短时间内大量、随机产生分子并选择其某一种生化特性的过程,也有望使我们能够在实验室中直接地研究生命起源早期的分子进化问题,一窥进化早期可能存在的分子类型,而不是局限于推测或模拟[27]. 整体而言,时至今日, 尽管我们对生命的起源问题有初步的认识,但如何在理论上认识和解释生命的起源过程尤其是形成稳定的代谢机制等细节仍然任重而道远.
上文在基于地球早期表面的组成成分及状态、化学、反应平衡、随机性等假设的基础上,提出了细胞或类细胞的构建过程和弱/遗传关系的建立过程,实际上是基于我们现有对地球、地质、化学、生命现象的认知来反推曾经可能出现或大概率情况可能发生的现象或反应,在某种程度上有点形而上学式的唯物主义的思维模式. 不但比较直接地排除了地外生命对地球生命产生所可能带来的影响,而且也直接回避了其他的所谓的超自然力量的介入. 从方法学的角度看,似乎欠缺辩证法思维,这与作者的认知框架有关,作者也乐见对地球生命起源感兴趣的学者从相反的思维方式来阐释生命的起源.
除上述理念外,我们感觉到似乎有必要对与上述理念密切关联的问题进行进一步思考. 譬如,根据上述对生命起源过程的分析,是否需要对生命的定义进行再审定[54]?原核细胞是生命的最初状态,那么从哪一刻开始才可以算作生命?是第一次完成完美的细胞分裂(即至少两个子细胞中的DNA 量基本一样)?还是在分裂前,细胞可以生存并长大到一段时间?在生命的早期过程中,保证DNA、RNA、蛋白质按照模板进行合成的过程可否称作生命现象?
由于生命起源的问题太过遥远和深邃、太过庞杂而又精准,文中所提供的逻辑分析方法可能会为问题的解决提供一个新的视角. 文中最后还是想重点强调的是:1)地球进化大约10 亿-13 亿年的时间才进化出原核生物[49],又经历了10 多亿年时间才进化出真核生物,而我们人类的历史则太短太短,约10 万年而已(从现代智人算起),对生命起源问题的思考,对其中出现的一些不可思议的现象,我们有必要用历史的维度来思考,相信在漫长的进化过程中,我们常说的小概率事件,实际上已经称为/成为常规事件了;2)早期化学反应的随机性或偶发性经过演化、筛选使得生物分子之间的反应也变得有限与定向,这些过程完全基于我们现在所熟知的化学成键规则与化学平衡理论,很显然,这一点是毋庸置疑的.
(致谢:文中作者深切感谢中山大学医学院刘迎芳教授、我校谭信教授、潘学峰副教授以及校外其他老师等在前期讨论中所提出的宝贵意见).