尽管植物构成了地球上80%的生物量,而动物仅占不到0.4%,但动物占据了所有已命名生物物种的多数,并且是迄今为止研究最深入的。有五个物种已成为分子、细胞和发育生物学研究的最重要的模式生物。按体型从小到大的顺序,它们是秀丽隐杆线虫(Caenorhabditis elegans)、黑腹果蝇(Drosophila melanogaster)、斑马鱼(Danio rerio)、小鼠(Mus musculus)和人类(Homo sapiens)。已确定了每个物种内许多不同个体的基因组序列。
秀丽隐杆线虫(Caenorhabditis elegans)是危害农作物的鳗形线虫的一种小的、无害的近亲。它具有仅有几天的生命周期、能够在冷冻箱中无限期地以假死状态存活的能力、简单的身体结构,以及非常适合遗传学研究的特殊生命周期,使其成为一种有吸引力的模式动物。C. elegans以精确的规律从一个受精卵细胞发育成一个恰好有959个体细胞(外加数量不定的卵细胞和精子细胞)的成年线虫——这对动物发育而言是不同寻常的规律性。我们现在对这种发育发生的事件序列有了极其详细的描述,因为细胞根据严格且可预测的规则分裂、移动和改变其特征。其基因组大约有1亿个核苷酸对,编码约20,000种蛋白质,并且有许多突变体和其他工具可用于测试基因功能。尽管这种线虫的身体结构与我们自己的大不相同,但生物学机制的保守性已足以使该线虫成为人类体内发生的许多发育和细胞生物学过程的模型。因此,举例来说,对线虫的研究对于理解介导和调节许多细胞死亡的分子机制至关重要,这些细胞死亡有助于控制动物细胞数量,无论是在正常发育中还是在人类癌症生长过程中。这种关键过程被称为程序性细胞死亡或细胞凋亡(apoptosis)。此外,对C. elegans的研究首次揭示了RNA干扰的许多迷人特征。它们也为神经元如何建立正确的连接提供了关键见解,并为细胞生物学的许多其他领域提供了信息。
对果蝇的研究提供了脊椎动物发育的关键线索
黑腹果蝇(Drosophila melanogaster)作为动物遗传学研究的模式生物比任何其他生物体使用的时间都长;事实上,经典遗传学的奠基在很大程度上是建立在对这种昆虫的研究之上的。例如,大约100年前,果蝇提供了确凿的证据,证明基因——当时抽象的遗传信息单位——是由染色体承载的,染色体的行为在真核细胞分裂过程中已通过光学显微镜被密切观察,但其功能最初是未知的。这一证据依赖于使果蝇特别适用于分子遗传学研究的众多特征之一——巨大的染色体,它在某些细胞中具有可见的特征性带状外观。事实发现,遗传信息中特定的变化,体现在突变果蝇家族中,与巨大染色体中特定条带的丢失或改变精确相关。
图《Molecular Biology of the Cell》7E Figure 1-44 果蝇唾液腺细胞中的巨大染色体(Giant chromosomes)。由于发生了多轮DNA复制而没有中间的细胞分裂,这些特殊细胞中的每条染色体都包含1000多条完全相同的双链DNA分子,它们都对齐排列。这使得它们很容易在光学显微镜下看到,在那里它们显示出特征性且可重现的带状模式。特定条带可以被确定为特定基因的位置:具有条带模式区域缺失或改变的突变果蝇显示出反映该区域基因缺失的表型(图中未显示)。以高速率转录的基因对应于具有“膨胀”外观的条带(黑色箭头)。显微照片中染成深棕色的条带是特定调控蛋白与DNA结合的位点;该调控蛋白是通过特定抗体的结合来识别的。(R. Paro, Trends Genet. 6:416–421, 1990)
在更近的时期,果蝇比任何其他生物体都更清晰地向我们展示了如何追溯因果链,从染色体DNA中编码的遗传指令到成年多细胞身体的结构。身体部位奇怪地错位(图1-43)或错位构型的果蝇突变体,为识别和表征制造出结构正确(肠道、四肢、眼睛和所有其他部分都位于正确位置)身体所需的基因提供了关键。
图1-43 黑腹果蝇(
Drosophila melanogaster)。(A) 一只正常的成年果蝇。对这种果蝇的分子遗传学研究为理解所有动物如何从受精卵发育成成年个体提供了主要关键。(B) 一只突变的成年果蝇,其中调控DNA序列中的一个突变导致腿部形成的基因在通常保留给触角的位置上异常激活;结果,本应是触角的地方发育出了腿。(A图作者:Edward B. Lewis;B图作者:Matthew Scott)
一旦这些果蝇基因被识别出来,科学家就可以识别脊椎动物中的同源基因,然后通过分析基因被突变的小鼠来测试它们在那里的功能。结果揭示了控制昆虫和脊椎动物发育的分子机制之间存在惊人程度的相似性。
所有已命名生物物种的大多数是昆虫。即使果蝇与脊椎动物没有任何共同之处,而只与昆虫有共同之处,它仍然是一个重要的模式生物。但是,如果目标是理解脊椎动物的分子遗传学,为什么不直接在脊椎动物身上迎面解决这个问题,而是通过研究果蝇来间接接近呢?
原因有很多。果蝇只需要9天就能从受精卵发育成成年;它比任何脊椎动物都更容易、更便宜饲养,而且它的基因组要小得多——大约1.8亿个核苷酸对,而人类的基因组约为31亿个核苷酸对。它的基因组编码大约14,000种蛋白质,并且几乎任何基因现在都有可用的突变体。除了对动物发育做出基础性贡献外,对果蝇的研究还继续揭示了生物学的许多其他见解,范围从中和病原体的深度保守机制到大脑中如何处理来自环境的外部刺激。
青蛙和斑马鱼提供了高度可及的脊椎动物模型
青蛙长期以来一直被用于研究脊椎动物胚胎发育的早期步骤。因为它们的卵大、易于操作,并且在动物体外受精,因此早期胚胎的后续发育可以容易地被追踪(图1-45)。非洲爪蟾(Xenopus laevis)仍然是一种重要的模式生物(影片1.6,参见影片21.1)。虽然这个物种不适合进行遗传分析,但从未受精的爪蟾卵中分离出的细胞质具有在试管中重现细胞结构和细胞器形成的非凡能力。这些卵提取物使得强大的生物化学方法能够研究细胞分裂周期等基本过程,如第17章所述。
相比之下,斑马鱼(Danio rerio)非常适合进行遗传分析。它的基因组紧凑——只有小鼠或人类基因组大小的一半——并且其世代时间只有大约3个月,这比非洲爪蟾要短得多。有许多突变体可用,并且基因操作相对简单。斑马鱼还有一个额外的优点:在其生命的前两周,它是透明的,因此可以很容易地在活体中追踪特定组织和单个细胞在发育过程中的行为。所有这些使其成为一个越来越重要的模式脊椎动物,尤其对于理解心脏和循环系统的发育至关重要。
小鼠是主要的哺乳动物模式生物
就基因组大小和功能、细胞生物学和分子机制而言,哺乳动物是一个高度统一的生物群。即使在解剖学上,哺乳动物之间的差异也主要在于大小和比例;很难想到一个人体部位在大象和小鼠身上没有对应物,反之亦然。进化可以自由地改变定量特征,但它不会轻易改变基本结构的逻辑。
哺乳动物编码蛋白质的基因通常比果蝇多约1.5倍,基因组比果蝇大约16倍,成年身体由比果蝇多出数百万或数十亿倍的细胞构成。为了精确衡量哺乳动物物种在遗传上的相似程度,我们可以比较相应(直系同源)基因的核苷酸序列,或这些基因编码的蛋白质的氨基酸序列。单个基因和蛋白质的结果差异很大。但通常情况下,如果我们对齐人类蛋白质的氨基酸序列与,比如说,大象的直系同源蛋白质的氨基酸序列,会发现超过80%的氨基酸是相同的。人类和鸟类之间的类似比较显示氨基酸一致性约为70%——因为鸟类和哺乳动物的谱系有更长的时间来分化,所以它们积累了更多的差异(图1-47)。
图《Molecular Biology of the Cell》7E Figure 1-47 不同脊椎动物的分化时间。左侧的刻度显示了每对指定动物的最后一个共同祖先的估计日期和地质时代。每个时间估计都基于直系同源蛋白质的氨基酸序列比较;一对动物独立进化的时间越长,保持相同的氨基酸百分比就越小。该时间刻度已根据化石证据进行校准,化石证据显示哺乳动物和鸟类的最后一个共同祖先生活在大约3.2亿年前。右侧的数字显示了特定蛋白质——血红蛋白的 α 链——的氨基酸序列分化程度。请注意,尽管对于这种蛋白质,分化程度随着时间的增加总体上有明显的增加趋势,但也存在不规则性,这被认为反映了自然选择的作用,即当生物体经历特殊的生理需求时,导致血红蛋白序列发生特别快速的变化。一些受到更严格功能限制的蛋白质的进化速度比血红蛋白慢得多,而另一些则可能快达五倍。(改编自 S. Kumar and S.B. Hedges, Nature 392:917–920, 1998)
小鼠因其体型小巧、强健且繁殖迅速,已成为哺乳动物分子细胞生物学实验研究的最主要模式生物。已知有许多自然发生的突变,在很大程度上模仿了人类相应突变的影响。此外,通过在基因或基因组的相关部分人工制造突变,可以测试任何选定小鼠基因或小鼠基因组任何非编码部分的功能。一只定制的突变小鼠就能为细胞生物学家提供大量信息。它揭示了所选突变在各种背景下的影响,同时测试了该基因在体内可能受到影响的许多不同类型细胞中的作用。
COVID-19大流行促使科学家们聚焦于SARS-CoV-2冠状病毒
SARS-CoV-2由于受到科学家的广泛关注,已成为理解真核病毒的模式系统。
冠状病毒基因组是大型的单链RNA分子,长约30,000个核苷酸。这种RNA被包装在一个蛋白质外壳中,外壳被脂质双层包膜覆盖,蛋白质刺突从包膜中伸出。
图《Molecular Biology of the Cell》7E Figure 1–49. (A) SARS-CoV-2 病毒颗粒附着在培养的猴细胞表面的电子显微照片(M. Laue et al. Sci. Rep. 11:3515, 2021)。 (B) 病毒的剖面图,突出了其突出的刺突蛋白分子以及其他几种主要蛋白质。刺突蛋白是旨在阻断感染的疫苗的主要靶点,因为它将病毒附着到宿主细胞外部,然后催化病毒基因组转移到细胞内部。如图所示,RNA 基因组不均匀地包装在有包膜的病毒颗粒内部。(C) SARS-CoV-2 产生的 29 种蛋白质,分为三个不同的类别。结构蛋白 S、M、E 和 N 在病毒中的位置已在图 B 中标出。“辅助蛋白”类别中列出的每种蛋白质都具有保护病毒免受宿主抗病毒反应的作用。非结构蛋白的功能包括:结合核糖体以阻断宿主蛋白质合成 (Nsp1),利用宿主细胞膜形成双层膜的“复制细胞器” (Nsp 3, 4, 和 6),以及形成RNA 依赖性 RNA 聚合酶 (Nsp 7, 8, 和 12)。
许多冠状病毒株在动物物种中循环,包括猪、鸟类和蝙蝠。一些毒株也在人类中循环;这些所谓的“地方性”毒株只会引起轻微症状,是大约四分之一普通感冒的病因。但极少数情况下,蝙蝠冠状病毒会以一种允许其感染人类的方式发生突变,并可能导致非常严重,甚至致命的疾病。据认为,2020年的COVID-19大流行就是以这种方式起源的。
SARS-CoV-2 产生29种蛋白质。其中一些是结构蛋白,用于将病毒的RNA基因组包装到病毒颗粒中。非结构蛋白对于在宿主细胞内复制病毒基因组以及确保病毒基因被正确翻译成蛋白质(包括病毒RNA聚合酶复合体)至关重要。而且,正如预期的那样,其他蛋白质有助于病毒逃避免疫防御。
SARS-CoV-2病毒与导致普通感冒的冠状病毒以及2002年从蝙蝠中出现并导致近十分之一感染者死亡的SARS-CoV病毒有密切关系。
我们仍然不明白为什么SARS-CoV和SARS-CoV-2感染比它们的近亲(仅引起轻微感冒)感染危险得多。
人类独有的对自身特征的报告
人类因其一个特殊的特性而成为具有吸引力的模式遗传生物:通过体检和自我报告,我们记录了我们自身的遗传(和其他)疾病。人类族群数量庞大,如今约有 80 亿个体,而这种自我记录的特性意味着存在一个巨大的人类突变及其效应数据库。此外,数百万人的人类基因组序列(超过 30 亿个核苷酸对)已被测定,这使得在分子层面识别任何既定人类突变表型背后的确切基因变化变得比以往任何时候都容易。
但是,当我们谈论人类基因组时,我们究竟指的是什么?是谁的基因组?平均而言,随机抽取的任意两个人,其 DNA 序列在大约 400 万个不同的位点上会有所不同。因此,人类基因组非常复杂,它囊括了在人类群体中发现的所有变异基因。对这种变异性的了解正帮助我们理解人类生物学;例如,为什么有些人容易患上某种疾病,而另一些人容易患上另一种疾病,以及为什么有些人对某种药物反应良好,而另一些人反应不佳。它也为我们的历史提供了线索,包括人口流动、我们祖先之间的杂交、他们遭受的感染以及他们的饮食。所有这些都在今天居住在我们星球上的人类社区中幸存下来的基因变异形式中留下了痕迹。
通过汇集来自人类、小鼠、鱼类、果蝇、蠕虫、酵母、植物和细菌的见解——利用 DNA 序列相似性来描绘一个模式生物与另一个模式生物之间的对应关系——我们正在极大地丰富对所有这些生物的理解。