【基础】
- 糖结合蛋白 #159
凝集素(Lectin)是一类能够特异性识别并结合多糖或糖蛋白中糖结构的蛋白质,属于糖结合蛋白,但不属于抗体。
图. 四种常见动物凝集素家族的代表性结构。显示的已定义的糖结合结构域 (CRDs) 包括:
(CL) C型凝集素;
(GL) 半乳糖凝集素 (galectin);
(MP) P型凝集素;
(IL) I型凝集素。其他结构域可能包括上皮生长因子 (EGF) 样结构域;免疫球蛋白 C2-set 结构域;跨膜结构域;以及补体调节重复序列,具体取决于家族和特定的家族成员。
凝集素的发现与历史
凝集素于 1888 年在植物中被发现,当时发现蓖麻籽提取物能凝集动物红细胞。随后,许多植物种子被发现含有这种“agglutinins”,后来当发现它们能区分人类 ABO 血型时,被重新命名为凝集素(lectins,拉丁语意为“选择”)。
凝集素在豆科植物的种子中尤其常见,这些“L 型”凝集素,包括伴刀豆球蛋白 A (concanavalin A) 和植物血凝素 (phytohemagglutinin),已被广泛研究。尽管这些植物凝集素特异性的聚糖结合活性使其成为极有用的科学工具,但它们在植物中的生物学功能仍大多未知。
发现的第一个动物凝集素是去唾液酸糖蛋白受体 (ASGPR),由 Anatol Morell 和 Gilbert Ashwell 在 20 世纪 60 年代后期,调查血清糖蛋白铜蓝蛋白的周转过程中鉴定。像大多数在血液中循环的糖蛋白一样,铜蓝蛋白具有复杂的以唾液酸为末端的 N-聚糖。为了制备放射性标记的铜蓝蛋白,去除了末端的唾液酸,暴露出半乳糖。令人惊讶的是,去唾液酸铜蓝蛋白(在兔子体内)的循环半衰期仅为几分钟,而完整的铜蓝蛋白则在血液中停留数小时。具有暴露 Gal 残基的糖蛋白被肝细胞通过一个内吞性细胞表面受体迅速清除,该受体特异性结合末端 β-连接的 Gal 或 GalNAc。ASGPR 通过使用固定化去唾液酸糖蛋白的亲和层析柱进行纯化。
随后发现了其他参与糖蛋白清除和靶向的聚糖特异性受体,包括:
通过对从粘菌 (Dictyostelium discoideum) 到哺乳动物组织等多种生物来源的提取物进行亲和层析,分离出了特异性结合 β-连接半乳糖的小型可溶性凝集素(现称为“半乳糖凝集素/galectins”)。到了 20 世纪 80 年代,脊椎动物凝集素识别特异性聚糖的概念已牢固确立。
尽管最早鉴定的动物凝集素是针对内源性聚糖的,但后来发现了许多针对微生物外源性聚糖的凝集素。识别外源性聚糖的凝集素包括在许多物种血液中循环的可溶性蛋白质,以及免疫细胞上的膜结合受体。
凝集素和硫酸 GAG 结合蛋白在微生物中也广泛存在,尽管它们通常被称为血凝素 (hemagglutinins) 和黏附素 (adhesins) 等其他名称。流感病毒血凝素(结合宿主细胞上的唾液酸)是第一个从微生物中分离出来的 GBP。病毒血凝素与许多植物凝集素一样,可以凝集红细胞。
许多细菌凝集素也已被描述。它们分为两大类:
细菌表面上的黏附素,识别宿主细胞表面糖脂、糖蛋白或 GAGs 上的聚糖,以促进细菌黏附和定植。
分泌型细菌毒素,结合宿主细胞表面的糖脂或糖蛋白。
凝集素的分类
根据凝集素所含 CRDs 的结构对凝集素进行分类是很方便的。
CRDs 存在于大量不同的结构类别中,表明许多不同的蛋白质折叠可以适应聚糖结合。基于这一观察,聚糖识别必然是独立进化了许多次,而 CRD 结构的多样性必然是为了应对功能多样性而产生的。
图. 几种主要的聚糖结合蛋白 (GBPs) 结构家族及其生物学分布。(CBM)糖结合模块;(EUL)欧洲卫矛凝集素 (Euonymus europaeus lectin);(ABA)双孢蘑菇凝集素 (Agaricus bisporus agglutinin);(EDEM)ER 降解增强型 α-甘露糖苷酶样蛋白;(GH)糖苷水解酶;(MRH)甘露糖受体同源性。
GBPs 出现在生命的所有域中,但每个界中的凝集素类型差异很大。有几个家族同时出现在原核生物和真核生物中,但它们的分布暗示了不同的进化历史。
Malectin 结构域虽然在结构上保守并广泛分布于原核生物、植物和动物中,但在这三组中却存在于具有不同结构域组织和不同功能的蛋白质中。动物 Malectin 是 ER 的膜锚定 CRD,在糖蛋白生物合成过程中结合 N-连接聚糖。在植物中,Malectin CRD 在细胞表面表达,并与细胞质激酶结构域连接。细菌 Malectins 由与糖苷水解酶结构域相关的 CRDs 组成。
类似地,植物中的 R 型 CRDs形成蓖麻毒素等毒素的细胞表面结合组分,并与细菌中的糖苷水解酶基因相连,但在动物中,它们出现在两种不同的背景下:启动 O-GalNAc 聚糖的多肽-N-乙酰半乳糖胺转移酶中和甘露糖受体家族中。
尽管这些 CRDs 已适应在不同界中服务于不同的功能,但聚糖结合功能似乎进化得很早并在随后的谱系中得以保留。
与具有广泛进化分布的 CRDs 相比,另外两组凝集素具有零星分布。
在这些情况下,进化上遥远物种中相关结构域的存在可能反映了水平基因转移,而不是它们共享的遥远共同祖先中存在前体凝集素。
对于 PA14 结构域(另一种在细菌和真核生物中发现的 CRD 类型),观察到不同的进化模式。尽管 PA14 折叠相对广泛,暗示它起源很早并跨物种保留,但只有一部分被证明具有聚糖结合活性:与细菌糖苷水解酶相关的 CRDs 以及酵母表面的黏附素和絮凝因子中的 CRDs。类似地,β-螺旋桨凝集素因其对细胞表面聚糖的高亲合力而在多种背景下进化,并存在于细菌、真菌和动物中。
前面提到的细胞内分选凝集素——如钙网蛋白、钙视网蛋白和 M 型凝集素——是最广泛分布的、从共同真核祖先进化的凝集素。它们的分布和功能的保守性可能反映了在真核生物中糖蛋白细胞内运输的古老和保守作用。
另外两组 CRDs 似乎仅在后生动物中发现,而不在更简单的真核生物中发现。
除了共享进化相关 CRDs 的蛋白质家族外,某些 CRD 家族在进化上是受限制的。除了动物特异性和脊椎动物特异性凝集素组外,还有仅在哺乳动物中发现的组,如 I 型凝集素。动物特异性凝集素的进化模式各不相同。
在植物凝集素中发现的 12 种不同蛋白质折叠中,有六种似乎是植物独有的。同样值得注意的是,病毒似乎已经开发出自己结合聚糖的方法,而不是从宿主那里借用。
除了共享进化相关 CRDs 的蛋白质家族外,还有通过与其他蛋白质中 CRDs 不相关的结构域结合聚糖的单个蛋白质。例子包括:
具有专用聚糖结合结构域的蛋白质,如一些识别 α-肌营养不良聚糖上聚糖的层粘连蛋白 G 结构域(第 45 章)。
结合修饰和磷酸化聚糖的五聚蛋白 (pentraxins)。
结合真菌葡聚糖和糖蛋白上暴露的 GlcNAc 残基的巨噬细胞 αMβ2 整合素。
其他蛋白质通过也具有其他配体的结构域结合聚糖:膜联蛋白 V (Annexin V) 结合二分 GlcNAc 残基以及磷脂,并且已报道几种细胞因子结合聚糖以及非聚糖受体。硫酸 GAG 结合蛋白也主要通过趋同进化而进化。
凝集素的组织 (organization of lectins)
在凝集素的鉴定、定义和分类中,一个重要的概念是聚糖结合活性体现在离散的蛋白质模块或结构域中,称为 CRDs (糖识别结构域)。
当凝集素仅由其 CRD 组成时,其功能通常依赖于多价性,这赋予了凝集素交联含聚糖结构的能力。这种排列解释了许多植物凝集素凝集细胞和聚集细胞表面糖蛋白的能力,这可以诱导有丝分裂以及其他信号通路。以这种方式发挥作用的其他 GBPs 包括半乳糖凝集素,它们可以桥接一个细胞表面上或细胞之间的聚糖。
有时其他活性编码在结合聚糖的同一结构域的结构内;一些由单个折叠结构域组成的细胞因子可能具有结合聚糖和其他靶受体的不同位点。更常见的是,凝集素的其他活性位于多结构域蛋白质中的独立模块中(图 28.2)。这种排列非常普遍。与 CRDs 相关的结构域执行许多不同的功能,包括结合其他类型的配体、执行酶促反应、将蛋白质锚定到膜上以及指导寡聚化。GBPs 通常包含多个模块,在一个蛋白质中结合了多种功能。
凝集素中的膜锚采取多种形式,但它们通常跨越膜,将细胞外 CRDs 与细胞质结构域连接起来。这种排列有助于细胞外表面上的聚糖结合位点与细胞质之间的信息流动。跨膜凝集素的细胞质结构域中的简单序列基序通常控制受体及其结合聚糖配体的运输。这种细胞内移动的常见功能包括细胞表面受体的内化、将结合的配体导向内涵体和溶酶体,以及通过细胞内区室(如 ER 和高尔基体)移动到细胞表面。相反方向的信息流可以导致响应细胞表面聚糖结合而刺激细胞质侧的信号复合物。
**聚糖结合位点的聚集(多价性)**通常对识别和生物学功能都至关重要,并通过不同方式实现:
形成 CRDs 的简单寡聚体。
单个受体多肽中存在多个 CRDs。
通过独立的寡聚化结构域关联含 CRD 的多肽。
一些寡聚体是稳定的,而其他一些,例如某些半乳糖凝集素形成的寡聚体,则与单体处于平衡状态。这些排列有助于多价结合以增加亲合力,并指导结合位点的几何排列。多个 CRDs 可以面向同一方向进行表面识别,或面向相反方向以促进交联。多价 CRDs 可以具有固定间距或灵活间距以适应不同的靶聚糖。在某些情况下,寡聚化结构域也形成结构特征,充当将 CRDs 从细胞表面突出的柄。寡聚化结构域也可以体现其他功能,例如甘露糖结合蛋白的胶原样结构域中的蛋白酶结合位点。