我们可能会识别出基因B类似于基因A,但我们最初是如何发现基因A的功能的呢?即使我们知道基因A的功能,我们又如何检验基因B的功能是否真的与其序列相似性所暗示的一样呢?
基因功能的分析依赖于两种高度互补的方法:生物化学和遗传学。
生物化学直接检查纯化分子的功能,例如由特定基因产生的蛋白质和 RNA:首先我们从生物体中获取该分子,然后详细研究其化学活性。遗传学则始于对突变体的研究:我们或者找到,或者制造一个特定基因被改变的生物体,然后检查这对突变生物体的结构和表现造成的影响。当与生物化学结合使用时,对某一特定蛋白质或 RNA 分子发生突变的生物体(及其分离的细胞)进行仔细研究,就能揭示该分子的生物学作用。
通过序列比较,我们通常可以识别出基因内特定子区域,这些区域在进化过程中几乎未发生变化而得以保留。就功能而言,这些子区域往往是基因最重要的部分。我们可以通过在实验室中在子区域内特定位点制造突变,或通过构建将一个基因的部分与另一个基因的部分结合起来的人工杂合基因来测试它们对基因功能的各自贡献。可以对生物体进行工程改造,使其大量表达由该基因编码的 RNA 或蛋白质,以方便生物化学分析。分子结构专家可以确定基因产物的三维构象,揭示其中每个原子的确切位置。生物化学家可以确定遗传编码分子的每个部分如何在其试管中的化学行为和功能中发挥作用。细胞生物学家则确定与目标分子相互作用的许多其他分子,以及所有这些分子在细胞内的位置。他们还分析经过工程改造表达突变版基因的细胞的行为。
然而,发现基因的功能并没有一个简单通用的秘诀。例如,我们可能会发现某个给定基因的产物是催化某种化学反应的酶,但仍然不清楚这种反应对生物体为什么重要或如何重要。每个新基因产物或基因产物家族的功能表征,不像基因序列的描述那样,对生物学家的独创性提出了新的挑战。此外,除非我们了解一个基因在生物体生命中的作用,否则我们永远无法完全理解它的功能,这意味着必须研究整个生物体,而不仅仅是分离的分子或细胞。