1. 对生命起源的早期猜想
从人类文明早期到十七世纪,自然发生学说一直占据着人们的主流思想——即认为生命物质是由无生命物质转化的结果。就连极富盛名的大物理学家牛顿也认为,植物是由逐渐变弱了的慧星尾巴形成的。后来,Louis Pasteur通过巧妙的鹅颈瓶实验证明了生物,即使是最简单的细菌,都不能从无生命的物质中自发产生,生命只能来自生命。1870年,Thomas Henry Huxley提出了生源说:“生命始终来自先前已经存在的生命。”
然而,如果说生命来自于已存在的生命,那这个已存在的生命又从何而来呢?关于生命起源的问题——这个在自然发生论者看来不是问题的问题——生源说却无法解决,所以生源说者经常会无赖地说:“生命是宇宙生来就固有的,你要问我生命从哪里来的,你首先给我回答一个问题,宇宙怎么起源的?物质怎么来的?你给我回答了物质是怎么来的,生命我就可以说是从哪儿来的。”因此,生源说其实是一个不可知论。
如果稍作比较,不难发现进化论与生源说其实面临着同样的难题——如果说高级生命是从低级的生命进化而来的,那么是否存在最低级的生命形态?它又是如何产生的?达尔文巧妙地避开了对生命起源的讨论才使得它不至于落入不可知论的泥淖,却让后世学者为他这不负责任的行为买单,经过几代人的努力,最终形成了一套初步的不尽完整的理论——化学进化论。
2. 化学进化论
化学进化论是被广大学者普遍接受的生命起源假说。这一假说认为,地球上的生命是在地球温度逐步下降以后,在极其漫长的时间内,由非生命物质经过极其复杂的化学过程,一步一步地演变而成的。
原始大气的主要成分有甲烷、氨、水蒸气、氢等,此外还有硫化氢和氢氰酸。这些气体在大自然不断产生的宇宙射线、紫外线、闪电等的作用下,就可能自然合成氨基酸、核苷酸、单糖等一系列比较简单的有机小分子物质。后来,地球的温度进一步降低,这些有机小分子物质又随着雨水,流经湖泊和河流,最后汇集在原始海洋中。
关于这方面的推测,已经得到了科学实验的证实。1935年,美国学者S.L.Miller等人,设计了一套密闭装置。他们将装置内的空气抽出,然后模拟原始地球上的大气成分,通入甲烷、氨、氢、水蒸气等气体,并模拟原始地球条件下的闪电,连续进行火花放电,最后,在U型管内检验出有氨基酸生成。
米勒实验证明了原始地球具备将无机物转化为有机物的条件,随后,原始地球条件下有机小分子如何进化到生物大分子便成为生命起源研究中新的实验课题。1958年,美国人S.W.Fox模拟原始地球的条件,将一些氨基酸溶液混合后倒人160℃~200℃的热沙或粘土中,使水分蒸发、氨基酸浓缩,经过0.5小时至3小时后就产生一种琥珀色的透明物质,它具有蛋白质的部分特性,因此被称为类蛋白质。Fox等认为,在原始地球不断有火山爆发的条件下,火山喷出气体中的甲烷、氨气和水蒸气等可能在高温条件下合成氨基酸,而氨基酸又可能通过热聚合反应而缩合为多肽。此外,也有人用模拟实验得到类似核酸的物质多聚核苷酸。实验表明,在50℃~60℃时,只要有多聚膦酸酯的存在,单个的核苷酸就可以聚合为多聚核苷酸。这些实验证明了有机小分子可以在原始地球上合成生物大分子如蛋白质,核酸等。饱含这种有机物的海洋环境成为了孕育生命的摇篮,被称为“原始汤”。
然而,线索行至此却突然模糊起来。关于有高分子物质如何成为了生命,我查阅了大量资料,绝大多数都是敷衍地说:“……生物大分子经过漫长的演化……终于形成了生命,然后进化……”的确,从无生命到有生命,这是地质史上一次质的飞跃,也是研究生命起源的一道难以跨越的鸿沟,目前,人类还不能在实验室里重现这一过程,然而,现代生命科学的飞速发展也让我们看到了零星的曙光,下面我将展示这些资料,以求尽量给读者一个满意的答案。
3. “生命源于共同祖先”
区别非生物与生物主要有两大特征:1、新陈代谢,即能够与环境进行物质和能量交换以维持其生长、运动和繁殖等生命活动过程。2、繁殖,即能够进行无限次数的自我复制。只要满足这两个条件则可视之为生物。
《物种起源》中虽然没有讨论生命起源的问题,但达尔文还是忍不住说了一句:“生命起源于一个普遍具有高度保守性的遗传信息片段,在相当广的范围内,通过不断的复制和分化得以进化,地球上所有现存物种源于一个原始的共同祖先。”至于那个共同祖先是什么东西,达尔文没有说,也无法说明。
为了跨越无生命与有生命之间的那道鸿沟,我们就必须找到那个共同祖先——地球上最原始的生命体,它必须满足上述两个条件,而且比它低级的任何一种形态都不能全部满足这两个条件。对于这样的生命体,可以确定,它早已灭绝,现存的化石记录里也没有,甚至我们很难在脑海里将其构造出来,不过,我们可以通过某些具体的信息向其逼近。
根据当代生物进化论研究者的观点,地球上的所有生命都可以归结到三个生物类群的某一类中。这三个类群分别是真核生物(Eukaryotes)、细菌(Eubacterial)和古菌(Archaea)。最近研究表明,细菌、古菌与真核生物很有可能源于同一个祖先,它是一种30亿年或40亿年前漂浮在“原始汤”周围的“原胞”实体,这种实体被称为“露卡(LUCA)”,也就是“第一个基本的共同祖先(Last universal common ancestor)”之意。然而,它没有留下任何已知的化石,也没有其他物理线索可揭示其身份。
但我们还是有蛛丝马迹可寻的。首先,我们必须明白,作为一个祖先,“露卡”应该具备以下两个特征:1、年代最久远。2、结构最简单。其中“年代最久远”是为了确保它的祖先地位,而“结构最简单”是为了确保它能由生物大分子直接形成。这两个特征其实并不等价,在原始单细胞生物领域,并非越低级的生物结构越简单,真核生物不一定比原核生物来得要晚(关于这一点我会在第4节说明)。而且在原始地球,退化的现象相当流行,突变即使令生物失去了某些结构,在生存竞争并不激烈的当时,它仍能生存繁衍。这一结论似乎给我们寻找同时满足这两个条件的“露卡”带来困难。
虽难如此,科学家们还是通过基因组分析和实验室模拟生成等巧妙的方法,初步描绘出“露卡”的肖像。
4. 基因组图谱下的“露卡”肖像
基因是个好东西。通过构建基因组水平DNA、RNA 和蛋白质序列分析的技术平台,科学家们在生物分类、生物进化及生命起源等领域取得了杰出成就。
那么,从基因分析中得到的“露卡”肖像又是怎样的呢?
最早应用基因分析研究“露卡”的科学家是伊利诺斯大学分子生物学家Woese。20世纪60年代末,Woese发明了一种通过比较rRNA小节序列来测量物种间关系的方法。假设基因突变会随着时间的推移自然增长,两种物种的rRNA越是不同,它们分离的时间就越久。
Woese测定了200多种原核生物的16S rRNA 和真核生物的18S rRNA 的序列,发现在原核生物中实际上有第三种类型生物:古菌。尽管古菌与细菌在许多方面相似,但缺乏定义的肽脂糖,并且具有几个真核细胞的特性。自此后,科学家采用一种新的分类系统,将生物分为三个域:古菌、细菌和真核生物。那么,这三个域是以何种顺序进化而来?换句话说,“露卡”更像细菌,古菌,还是真核生物?鉴于当时条件,Woese并未解答。如今,这个问题是否已得到解决?
20世纪80年代,科学家对rRNA所进行的进一步比较表明,细菌是最古老的域。这与我们的常识相一致,因为原核生物无论从那方面看都比真核生物简单,甚至很多人认为细菌是通过融合、内共生、内吞作用、膜内陷等方式进化成真核生物的。并不是所有人都同意这一观点,法国巴黎大学的帕特里克•福特勒教授就是其中一位主要反对者。福特勒教授指出,尽管真核生物更复杂,但它们也充斥着原始结构。例如,真核生物染色体包括成串线状DNA,这需要一种称为端粒的分子来保护其末梢在复制过程中不受损坏,而细菌染色体是环状,所以不需要端粒来保护。
至于为什么细菌在基因分析中表现得更古老,福特勒教授解释说,基因分析方法本身存在一个重大缺陷:没有将不同域的突变的不同速度考虑进去。与真核生物相比,细菌圆滑,在制造蛋白质方面效率更高,它们可以在几秒钟内就启动蛋白质合成道路上的第一步,而同样的生物进程真核生物需要半个小时,所以,在同一时段内细菌基因的变异会比真核生物大得多,因此单从基因分析得到结果来看,细菌等一些进化速度更快的直系后代看上去比实际要“老成”,造成细菌比真核生物古老的假象。
由于原始生命突变的速度难以确定且与突变本身有关,这一重大缺陷便使得基因分析的说服力大大下降。而最近发现的另一个重大缺陷又使坚持基因分析法的科学家们不得不转变思维。
20世纪90年代,首批基因组排序计划宣告完成,这使得研究人员能列出所有生命形式共同的基因。但令人吃惊的是,“生命树”所有的基因数量结果却相当少。例如,最新一项研究对100个物种进行了比较,结果只发现60个基因是普遍存在的。这种分析揭示的仅仅是哪些基因是原始的,而与这些基因“落户”的物种没有关系。由此科学家们意识到,基因可能在不同的物种间进行转移。
基因平行转移是比较基因组序列得到的一个令人震惊的结果。这说明原始细胞的所有组成成分很容易通过基因平行转移的方式进行改变或取代,这或许是当时生命进化的主要动力,却为基因分析带来了更大的麻烦,基因的整合使生物的基因组变得杂乱无章,并且这种整合是随机的,基因组的特征便很难向我们表达它应该包含的信息。而我们要寻找的“露卡”位于这些原始生物的最低层,它的基因组早就被平行转移掺和得面目全非,直接追溯“露卡”的基因组无疑困难重重。
然而,随着细胞变得越来越复杂,这种平行转移将逐渐减少,一旦到达某种临界复杂程度,即细胞的各成分出现了高度的整合——称为达尔文式阈值(Darwinian threshold)——基因的平行转移将停止,基因组开始取决于遗传,具有不同特征的直系后代开始出现,这样一来基因分析便颇具参考价值。于是,科学家们只好转而研究达尔文阈值以上的生物的基因组,以此来推断“露卡”的基因组成。
在寻找“露卡”的过程中,研究古细菌的基因组非常重要,因为古细菌的生长环境更接近原始地球的状态。1996年,科学家们解析了从深海发现的古细菌物种詹氏甲烷球菌(Methanococcus jannaschii)的基因组全序列。这是第一个被分析的古细菌类生物的基因组,其主要的环状染色体共有150万对碱基,含大约1700个基因。通过比较基因组研究,研究者推断出“露卡”可能具备这样一些特征:蛋白质合成的装置最为发达,但尚未完全;RNA合成的功能要比蛋白质合成差一些;而DNA合成的机制则基本没有。此外,它具有较为发达的代谢途径,包括氨基酸和核苷酸代谢,以及辅酶的合成等。
然而1700个基因对于“露卡”这位祖先来说似乎是太多了,“露卡”的结构必须尽量简单以确保它能从无生命的形态直接演变而来。那么,还有没有更简单的模型?
生殖道支原体(Mycoplasma genitalium)是一种寄生细菌,它的基因组是目前已测定的物种基因组中最小的一个,仅有468个基因。科学家将它的基因组与另外一种细菌流感嗜血杆菌(Haemophilus influenzae)的基因组序列进行了详细的比较,发现有240个生殖道支原体基因与流感嗜血杆菌基因存在垂直同源性。经过进一步研究,科学家们得出结论“露卡”至少需要大约250个基因。
5. “人工露卡”与多分子体系
“露卡”肖像的确定除了通过用计算手段比较基因组以外,另一个重要的途径是采用实验的手段。
其实上个世纪生物学界一直流行着一种寻找“最小基因组”的“游戏”,即找到那个包含最少基因却又能刚好维持生命体生命活动的基因组序列。这一过程一般是在实验室里完成,而所得到的那串基因组序列及其操控的生命体实际上反映了“露卡”的特征,所以我们可以把这些生命体称为“人工露卡”。
早在比较基因组方法出现之前,美国科学家M. Itaya就利用基因剔除方法,在细菌枯草芽孢杆菌(Bacillus subtilis)基因组上随机敲除了79个基因,通过分析这些基因剔除品系是否存活来探讨最小基因组,从而得到了第一个“人工露卡”。另一位著名的科学家C. Venter也采用基因剔除的办法,对上一节所说的生殖道支原体的基因逐个进行敲除,并检查其存活情况,最终得出结论,生殖道支原体有可能只需要265到350个基因就可以生存。
这个结果与比较基因组方法得到结果惊人地相似。Venter得到的“人工露卡”也许能很好地描述“露卡”的特征,通过对这一“人工露卡”形态与生活史的进一步研究,一张“露卡”的肖像隐约浮现在了我们眼前:
(1)含有250到350个基因,不含内含子
(2)一套基本上完整的DNA复制系统
(3)一套进行DNA重组和修复的系统
(4)一个几乎完整的转录、翻译系统
(5)一组具有4个RNA聚合酶亚单位的转录装置
(6)一组参与蛋白质折叠的分子伴侣蛋白
(7)一组蛋白质转运机器
(8)完整的无氧中间代谢途径
(9)一条辅酶合成途径
(10)一种将生命体与周围环境隔开的结构
这一套机制确保了生命体能够繁殖、表达、遗传、变异、进化以及代谢,这是对生命的基本要求,也是“露卡”最可能的模样。我们不妨吧这一机制称为“露卡机制”。
这也许很令人沮丧,因为“露卡”看起来也很复杂,我们很难想象生物大分子是如何形成这一机制的。那么,还有没有更简单的模型?
我们以上讨论的都是从已知物种出发由复杂向简单逼近“露卡”的追溯过程,那么,可不可以从生物大分子出发由简单向复杂逼近“露卡”呢?
1924年,前苏联生物学家A.I.Oparin在实验的基础上提出团聚体学说(Coacervate Theory),认为生物大分子蛋白质和核酸的溶液混合在一起时可以形成团聚体,这种多分子体系表现出一定的生命现象。奥巴林将明胶(蛋白质)溶液与阿拉伯胶(糖)溶液两种透明的溶液混合在一起,混合之后溶液变为混浊,显微镜下可以看到均匀的溶液中出现了小滴,即团聚体。用蛋白质、核酸、多糖、磷脂及多肽等溶液也能形成这样的团聚体。这种团聚体直径1—500微米,外围可形成膜一样的结构与周围的介质分隔开来,能稳定存在几个小时至几星期时间,并表现出简单的代谢、生长、增殖等生命现象。
20世纪60年代,美国人S.W.Fox提出了微球体学说(Microsphere Theory),强调了蛋白质在生命起源中的重要作用。他将于燥的氨基酸粉末混合加热后在水中形成了类蛋白微球体,并把它看成是原始细胞的模型。这种微球体直径较均一,在1—2微米之间,相当
图2 团聚体(右)与微球体(左)
Fig.2 Coacervate(right) and microsphere(left)
于细菌的大小。它表现出很多生命特征:其表面具有双层膜,能随着介质的渗透压变化而膨
胀或收缩;能吸收溶液中的类蛋白质而生长,并能像细菌那样进行繁殖;在电子显微镜下还
可以观察到它具有类似于细菌的超微结构。
这种团聚体或微球体统称为“多分子体系”,那么,多分子体系是否就是“露卡”呢?答案是否定的。多分子体系虽然能够进行简单的代谢、生长和增殖等生命活动,但是它与真正意义上的生命还是有本质的区别的,因为它没有完整的“露卡机制”,它不能完成核酸的复制、转录与翻译。也就是说,它虽然能简单地分裂形成多个个体,但却不能将其性状遗传下去,不能遗传倒没什么,但是不能遗传也就意味着不能进化,作为一种不能进化的“生物”,它完全没有资格拥有“祖先”这个称号。“露卡”与其本质的区别就在于它已经具备了这套机制,它能够进化。
多分子体系虽然还不能成为“露卡”,但它的发现还是有其意义的,它揭示了生物大分子之间能够相互作用形成具有生命活力的分子团,如果说“露卡”理论是从上往下逼近了达尔文所言的“共同祖先”,那么“多分子体系”理论则是从下往上向其逼近。好,我们的鸿沟变窄了,现在只剩下一个问题:“露卡机制”是如何产生的?
对于这一问题,我只能说,“露卡机制”的产生是一个谜,现代科学在这方面的研究收效甚微,不但如此,我们的科学越是发展,我们对DNA复制、转录和翻译的机制知道得越多,我们越是对它那高度的精确与智能百思不得其解。即使到目前,如果我们仍相信进化论,我们也只能说,它是多分子体系在“漫长的演化”中逐渐形成的。
简单地说,进化。
由第一个细胞发育而来
DNA是如何形成的呢