I 型凝集素 (I-type lectins) 被定义为 聚糖结合蛋白 (glycan-binding proteins, GBPs)(不包括抗体和 T 细胞受体),其结合结构域与庞大且多样的 免疫球蛋白超家族 (immunoglobulin superfamily, IgSF) 蛋白质具有同源性。
在 I 型凝集素中,Siglec 家族(唾液酸识别凝集素)是结构和功能上特征最明确的亚组,因此是本章的主要焦点。本章将详细介绍它们的发现、特征、结合特性和生物学特性,并讨论它们在脊椎动物生物学中的功能作用,其中目前的大部分信息来源于哺乳动物,并涉及人类进化过程中的多项不寻常变化。
---
历史
Ig 折叠 (Ig fold) 由 反平行 β 链 组成,组织成一个包含 100-120 个氨基酸的 β 三明治 ( β-sandwich),通常由一个 层间二硫键 (intersheet disulfide bond) 稳定。Ig 结构域根据序列和结构与抗体结构域的同源性定义了三种类型或“集合”:
V-集 (V-set) 结构域:变异区样结构域 (variable-like domain)。
C1-和 C2-集 (C-set) 结构域:恒定区样结构域 (constant-like domains)。
I-集 (I-set) 结构域:结合了 V-集和 C-集结构域特征的结构域。
在 20 世纪 90 年代之前,人们认为 抗体 是唯一能够识别聚糖的 IgSF 成员。非抗体 IgSF 聚糖结合蛋白的第一个直接证据来自对 唾液酸粘附素 (sialoadhesin, Sn)(小鼠巨噬细胞亚群上的唾液酸 [Sia]-依赖性结合受体)和 CD22(先前克隆为 B 细胞标志物)的独立研究。
各种技术表明 Sn 作为一种凝集素发挥作用,包括配体经 唾液酸酶 (sialidase) 处理后结合丧失、唾液酸化化合物 的抑制实验,以及纯化受体对糖蛋白和经修饰携带不同连接 Sia 的红细胞的 Sia-依赖性结合。对于重组 CD22,唾液酸酶处理阻断细胞粘附相互作用,导致其被发现是一种 Sia 结合凝集素,对 α2−6 连接的 Sia 具有高度特异性。
随后,Sn 的克隆表明它是一个 IgSF 成员,与 CD22 以及另外两个先前克隆的蛋白 CD33 和 髓鞘相关糖蛋白 (myelin-associated glycoprotein, MAG) 具有同源性。CD33 和 MAG 的 Sia 识别被证明后,定义了一个新的 Sia 结合分子家族,最初被称为 “唾液酸粘附素” (sialoadhesins)。同时,出现了其他 IgSF 成员结合聚糖的初步证据,有人建议将所有这些分子归类为 “I 型”凝集素。然而,很明显,这四个 Sia 结合分子是一个独特的亚组,它们既共享 序列同源性 又共享 Ig 结构域组织,并且并非都参与粘附。因此,Siglec(sialic acid–binding immunoglobulin-like lectin,唾液酸结合免疫球蛋白样凝集素)一词于 1998 年被提出。随后,大多数 CD33 相关 Siglecs (CD33rSiglecs) 是通过基因组和转录组测序项目发现的,这些项目允许通过计算机识别新的 Siglec 相关基因和 cDNA。
---
Siglec 的亚组和演化
Siglecs 根据 序列相似性(图 35.1)和在哺乳动物物种中的 保守性,被分为两个主要亚组:
第一组 (保守 Siglecs):包括 Sn (Siglec-1)、CD22 (Siglec-2)、MAG (Siglec-4) 和 Siglec-15。它们在所有被检查的哺乳动物物种中都有明确的 直系同源物 (orthologs),并且彼此之间仅共享约 25%–30% 的序列同一性。
第二组 (CD33rSiglecs):包括 CD33rSiglecs。它们共享约 50%–80% 的序列相似性,但似乎在 快速进化,并经历着 外显子改组 (exon shuffling) 和 Ig 结构域编码外显子 的 基因转换 (gene conversions),这使得定义直系同源物变得困难,即使在啮齿动物和灵长类动物之间也是如此。
由于第二个原因,Siglec 命名法使用数字和字母来区分一些非同源的人类和小鼠 Siglecs。回想起来,事实证明许多远缘相关的哺乳动物具有更明确的直系同源物,而 啮齿动物谱系 是“丢弃”了这些基因的。
---
除 Siglecs 外的 I 型凝集素
除了 Siglecs 之外,还提出了几种 IgSF 成员结合聚糖或糖共轭物。最好的证据是针对 成对免疫球蛋白样 2 型受体 (PILR−α 和 PILR−β),两者都具有一个类似于 Siglecs 的单个 V-集结构域,具有结构明确的 Sia 结合位点以及一个蛋白质相互作用位点。
PILR 蛋白 结合一组 粘蛋白样 O-糖基化膜蛋白,涉及同时识别 肽骨架 和 Sia 以介导高亲和力相互作用。
PECAM-1 (Platelet endothelial cell adhesion molecule-1) 由六个细胞外 Ig 样结构域组成,并选择性识别 α2−6 连接的 Sia。
NCAM (Neural cell adhesion molecule) 和 Basigin (CD147) 被声称可以识别和结合神经系统上相邻糖蛋白上的 寡甘露糖型 N-聚糖。
ICAM-1 (Intercellular adhesion molecule-1) 包含五个 Ig 样结构域,结合众多配体,包括整合素 LFA-1 和 Mac-1、透明质酸,并可能结合某些粘蛋白型糖蛋白。
Hemolin 是一种来自鳞翅目昆虫的 IgSF 血浆蛋白,结合来自革兰氏阴性细菌的 脂多糖 (LPS) 和来自革兰氏阳性细菌的 脂磷壁酸 (lipoteichoic acid)。
---
Siglecs 的共同特征
氨基末端 V-集唾液酸结合结构域
所有 Siglecs 都是 I 型膜蛋白,具有一个 Sia 结合 的氨基末端 V-集结构域,以及数量不等的 C-集 Ig 结构域 作为间隔物,将 Sia 结合位点投射到远离质膜的位置。
V-集结构域和相邻的 C-集结构域包含少量不变的氨基酸残基,包括 F β 链上必需的精氨酸(Sia 结合所需)和不寻常的 半胱氨酸残基组织。
与典型的 B 和 F β 链之间的层间二硫键不同,Siglecs 的 V-集结构域显示 B 和 E β 链之间存在层内二硫键 (intrasheet disulfide bond),允许 β 链之间增加分离。由此产生的 疏水残基暴露 允许与 Sia 配体的成分进行特异性相互作用。
所有已研究的 Siglecs 似乎还包含一个 V-集结构域与相邻 C-集结构域之间 的额外不寻常二硫键,预计会促进前两个 Ig 结构域界面的紧密堆积。
虽然所有 Siglecs 似乎都使用一个 共同模板 来识别 Sia(图 35.2),但它们对 延伸聚糖链 的结合偏好差异很大。
C 和 C' β 链之间的肽环 在 Siglecs 中高度可变,并在决定它们的 精细糖特异性 (fine sugar specificity) 中起着关键作用。
---
掩盖和揭示 (Masking and Unmasking)
大多数脊椎动物细胞的细胞表面 糖萼 (glycocalyx) 富含含有 Sia 的糖共轭物。Sia 的高局部浓度可能大大超过每个 Siglec 的 Kd 值,导致 在同一膜上 (cis) 与唾液酸聚糖自结合,这可以直接发挥功能,或者可以“掩盖 (mask)” Sia 结合位点,使其无法与其他细胞上 (trans) 的唾液酸聚糖相互作用。
因此,大多数天然表达 Siglecs 的 Sia-依赖性结合活性在细胞经唾液酸酶处理以消除 顺式 (cis)-相互作用的唾液酸化聚糖 后会强烈增强。一个值得注意的例外是 Sn,它是通过其作为巨噬细胞上 Sia-依赖性细胞粘附分子的天然特性被发现的。大多数 Siglecs 的“掩盖”状态是与多个顺式配体之间的 动态平衡。
---
细胞类型限制性表达
Siglecs 在单一或相关细胞类型中显示出 限制性的表达模式。
保守 Siglecs:Sn(巨噬细胞)、CD22(B 淋巴细胞)、MAG(髓鞘形成细胞)和 Siglec-15(破骨细胞)。
CD33rSiglecs:在人类中,Siglec-6(胎盘滋养细胞)、Siglec-7(NK 细胞)和 Siglec-11/-16(组织巨噬细胞,包括人脑小胶质细胞)。在小鼠中,Siglec-H(浆细胞样树突状细胞 [DCs])和 CD33(血液中性粒细胞),以及 Siglec-F(嗜酸性粒细胞和肺泡巨噬细胞)。
---
基于酪氨酸的信号传导基序
大多数 Siglecs 在其细胞质尾部有一个或多个 基于酪氨酸的信号传导基序,或与含有胞质酪氨酸基序的 膜衔接蛋白 (membrane adaptor proteins) 相关联。
最主要的基序是 ITIM (Immunoreceptor Tyrosine-based Inhibitory Motif),具有共识序列 (V/I/L)XYXX(L/V)。ITIM 包含的 Siglecs 在酪氨酸被 Src 家族激酶磷酸化后,通过募集和激活 SH2 结构域效应物,特别是 蛋白酪氨酸磷酸酶 SHP-1 和 SHP-2,发挥作用,抵消 含有 ITAM 的受体触发的激活信号。
一些 Siglecs(如 Siglec-14, -15, -16 和 Siglec-H,以及小鼠 CD33)在跨膜区域内含有一个 带正电荷的残基,可以与含有 ITAM 的 DAP12 衔接子 相关联,从而介导激活功能。
---
保守 Siglecs 的表达模式和功能
唾液酸粘附素 (Sn, Siglec-1, CD169)
Sn (CD169) 被鉴定为由小鼠基质巨噬细胞表达的 Sia-依赖性羊红细胞受体。Sn 具有异常多的 Ig 结构域(十七个),这在哺乳动物和爬行动物中是保守的。
Sn 偏爱 α2−3 连接的 Sia 甚于 α2−6 和 α2−8 连接的 Sia。
Sn 表达似乎特异于 巨噬细胞亚群,特别是驻留在淋巴组织中的巨噬细胞。
Sn 可被 I 型干扰素 强烈诱导。Sn 在 HIV 感染者循环单核细胞和类风湿性关节炎、原发性胆汁性肝硬化和系统性红斑狼疮 (SLE) 患者的巨噬细胞上调。
Sn 可以有效介导 捕获和摄取 B 淋巴细胞凋亡后释放的 外泌体 (exosomes)。
Sn 在巨噬细胞与各种唾液酸化细菌和原虫病原体(如脑膜炎奈瑟菌、空肠弯曲菌和克氏锥虫)的 吞噬相互作用 中发挥作用。
Sn 表达可以被展示宿主来源 Sia 的 有包膜病毒 利用,导致它们的捕获、摄取和传播,例如 HIV。
---
CD22 (Siglec-2)
CD22 是一种 B 细胞上发育调控的细胞表面糖蛋白。它有七个 Ig 样结构域,细胞内区域有六个基于酪氨酸的信号传导基序,其中三个可作为 ITIM。
CD22 是公认的 B 细胞活化的负调节因子,对通过 B 细胞受体 (BCR) 复合体的信号传导阈值做出了重要贡献。
在所有 Siglecs 中,CD22 对唾液酸化配体的特异性 最保守,主要结合 α2−6 连接的 Sia,如 Neu5Ac(或 Neu5Gc)α2−6Galβ1−4GlcNAc。
在 B 细胞上,CD22 似乎主要以 顺式 (cis) 方式与其他 CD22 分子相关联,或者与 BCR 相关联(以聚糖非依赖性方式抑制后者)。
CD22 还可以介导与 其他细胞上 的唾液酸化配体的 反式 (trans)-相互作用,将 CD22 从 BCR 隔离。
CD22 缺陷小鼠 和 Siglec-G 缺陷小鼠 共同缺乏会导致 SLE 样症状。
CD22 是一个有吸引力的治疗靶点,例如用于治疗急性 B 细胞白血病和毛细胞白血病的抗体偶联药物。
---
髓鞘相关糖蛋白 (MAG, Siglec-4)
MAG 是中枢神经系统 (CNS) 和周围神经系统 (PNS) 髓鞘的次要成分。它有五个 Ig 样结构域,在脊椎动物中高度保守。
MAG-缺陷小鼠的髓鞘发育正常,但随着动物年龄增长,髓鞘和轴突的缺陷增加,表明 MAG 在髓鞘化轴突的维持中起作用。
MAG 信号传导对于最佳的髓鞘-轴突相互作用是必需的。MAG 缺陷小鼠显示晚发性轴突变性。
MAG 直接抑制体外各种神经元细胞类型的 神经突生长 (neurite outgrowth),这有助于髓鞘在神经系统损伤后对轴突生长的抑制活性。
神经节苷脂 (Gangliosides)(唾液酸化糖脂)是 MAG 的重要生理配体,介导髓鞘-轴突稳定性和抑制轴突生长。
---
Siglec-15
Siglec-15 缺乏其他 Siglecs V-集 Ig 结构域中典型的半胱氨酸排列。它能结合 唾液酸-Tn 结构 (Sialyl-Tn structure, Neu5Acα2−6GalNAcα) 和其他含有 Neu5Acα2−6HexNAc 决定簇的结构。
它与 DAP12 相关联,但其细胞质尾部也有一个 ITIM 样基序。
Siglec-15 最强烈地表达于 破骨细胞 (osteoclasts) 及其前体,与 RANK (receptor activator of NF−κB) 一起,在触发破骨细胞分化中发挥重要作用。
Siglec-15 缺陷小鼠 表现出轻度的骨硬化症 (osteopetrosis) 和破骨细胞分化受损。
Siglec-15 也表达于一些肿瘤组织中,是治疗绝经相关骨质疏松症和癌症的新靶点。
---
CD33 相关 Siglecs 的基因组、表达和功能
编码大多数 CD33rSiglec 亚家族 的基因聚集在人 19q13.3-13.4 染色体 上或小鼠 7 号染色体的同源区域。
- 由于大多数 IgSF 结构域由具有 Phase-1 剪接接头 (phase-1 splice junctions) 的外显子编码,允许外显子改组而不破坏开放阅读框,以及 Sia 结合 V-集结构域的快速进化,很难在灵长类动物和啮齿动物之间确定所有明确的直系同源物。
---
CD33 (Siglec-3)
CD33 是人类早期髓系祖细胞和白血病细胞的标志物,也表达在单核细胞和组织巨噬细胞(包括脑小胶质细胞)上。它有两个 Ig 结构域。
CD33 是第一个被表征为抑制性受体的 CD33rSiglec,抑制 FcγRI 活化并募集 SHP−1 和 SHP−2(图 35.5)。
CD33 治疗白血病的策略包括使用偶联毒性抗生素的抗-CD33 单克隆抗体(吉妥珠单抗 (gemtuzumab ozogamicin))。
两个共遗传的 SNPs(单核苷酸多态性)与人类对迟发性阿尔茨海默病的保护有关,它们导致 CD33 缺乏 V-集结构域 的水平增加。
---
Siglec-5 (CD170) 和 Siglec-14
SIGLEC5 和 SIGLEC14 基因相邻。它们编码的蛋白质的前两个 Ig 结构域具有 >99% 的序列同一性,但随后分离:
两者结合相似的配体,对 唾液酸-Tn 结构 和 α2−8 连接的 Sia 有偏好。一个 SIGLEC14-缺失等位基因 在亚洲人群中常见,并与 慢性阻塞性肺病 (COPD) 患者的发作减少有关。
---
Siglec-7, Siglec-9 和 Siglec-E
Siglec-7 和 Siglec-9 具有高度序列相似性,似乎通过基因复制进化而来。
Siglec-7 是人类 NK 细胞 上的主要 Siglec。
Siglec-9 主要表达在中性粒细胞、单核细胞、巨噬细胞和 DCs 上。
小鼠 Siglec-E 结合了 Siglec-7 和 Siglec-9 的一些特征,是中性粒细胞的重要抑制性受体。
---
Siglec-8 和 Siglec-F
Siglec-8 表达在嗜酸性粒细胞和肥大细胞上。
---
Siglec-10 和 Siglec-G
Siglec-10 在几种免疫系统细胞上表达,并在 肝细胞癌 中肿瘤浸润的 NK 细胞上可强烈上调。
它是唯一在小鼠中具有明确直系同源物(Siglec-G)的 CD33 相关人类 Siglec。
两者都偏爱 Neu5Gc 甚于 Neu5Ac。
Siglec-G 缺陷小鼠 显示 B1a 细胞数量增加 10 倍。
CD24(在某些癌症中过度表达)与巨噬细胞上的 Siglec-10 结合以抑制吞噬作用。
---
Siglec-11 和 Siglec-16
Siglec-11 和 Siglec-16 是成对的抑制性和激活性受体。它们的胞外区域因为基因转换而高度相同。
它们广泛表达于 组织巨噬细胞,包括大脑中的常驻小胶质细胞 (resident microglia)。
Siglec-11 在小胶质细胞上的表达似乎人类独有。
Siglec-16 在大多数人类中因 4 碱基对缺失而功能性受体表达率低 (∼35%)。
---
Siglec 生物学中人类特有的变化
人类在进化过程中(约 2-3 百万年前)丧失了 Neu5Gc,这可能导致一些 Siglec 的揭示 (unmasking),从而可能导致先天免疫反应增强。
Sn 在大多数人类巨噬细胞上表达,而在黑猩猩巨噬细胞中仅在亚群中阳性,这可能与 Sn 强烈偏爱人类合成的 Neu5Ac 有关。
人类 Siglec−5 和 Siglec−14 的 Sia 识别所需的“必需”精氨酸残基似乎已经恢复,但在黑猩猩、大猩猩和猩猩中是突变的。
Siglec−12 经历了人类特有且普遍的“必需”精氨酸残基失活。
Siglec−13 经历了人类特有的基因缺失。
Siglec−6 的胎盘表达和 Siglec−5/14 的羊膜上皮表达是人类特有的。
---
CD33 相关 Siglecs 的非唾液酸化配体
虽然 CD33rSiglecs 可以通过识别内源性唾液酸聚糖作为 “自我相关分子模式” (SAMPs) 来调节先天免疫细胞反应,但许多病原体通过在其表面生成唾液酸化分子模拟物来利用这一特性。
病原体也进化出了通过 蛋白质-蛋白质相互作用 直接与 CD33rSiglecs 结合的机制,例如 Ia 型 GBS 的 β-蛋白 与人类 Siglec−5 和 Siglec−14 的结合不依赖于 Sia。早期证据表明存在更多此类例子,以及宿主内替代的非唾液酸化内源性配体,例如热休克蛋白 HSP−70、心磷脂和另一种自身聚糖透明质酸。