分泌蛋白质组(Secretome)是指由细胞或器官分泌的全部蛋白质。
分泌蛋白通过调控细胞之间的相互作用,在人体正常的信号转导等生理过程中发挥着重要作用,并且与多种疾病的发展密切相关,包括癌症、代谢性和神经性疾病。
在许多疾病中,分泌蛋白会创造有利于疾病发展的条件,例如促进癌症转移的蛋白。因此,了解细胞分泌组的定性和定量组成,对于理解细胞相互作用的生物学机制至关重要。这些知识可用于识别疾病生物标志物(如前列腺特异性抗原)或潜在的药物靶点。
细胞间通信对维持所有多细胞生物的稳态至关重要,而这种通信通常是由细胞因子、趋化因子和激素等分泌蛋白介导的。信号蛋白的有效传递是新陈代谢和免疫等基本过程的基础,这些过程依赖分泌蛋白以旁分泌或自分泌的方式引发细胞反应。
How many secreted proteins are glycoproteins?
66%的分泌蛋白被UniProt注释为糖基化蛋白[EMBO J. 2012, 31, 3157]。
How many potential shedding substrates are glycoproteins?
87%的I型和II型跨膜蛋白被UniProt注释为糖基化蛋白[EMBO J. 2012, 31, 3157]。
如何鉴定分泌蛋白?
虽然经典的分子生物学方法(如基于抗体的方法)早已用于研究分泌蛋白^[Cancer Res. 1988, 48, 5193],但是这些方法难以进行大规模的分泌蛋白分析。
基于质谱的分泌蛋白质组学分析是鉴定和表征分泌蛋白的强大策略。然而,要有效地大规模鉴定和定量分泌的糖蛋白仍然面临一些挑战。
一种常见的分泌蛋白识别方法是对目标细胞类型的培养上清液(即条件培养基 Supernatants from cell cultures (also called conditioned media, CMs) )进行蛋白质组分析。此类实验可分为两种:
Serum-containing culture. 在含有血清的培养基中培养细胞。但这种方法通常需要进行广泛的蛋白质和/或肽段分级,以便在大量高丰度的血清蛋白(浓度在毫克/毫升级别)背景下检测低丰度的分泌蛋白(浓度在纳克/毫升级别)。
Serum-free culture. 使用无血清培养条件,以减少分析干扰并提高分泌蛋白的检测能力。虽然无血清培养也被用作同步细胞周期和研究细胞应激或凋亡的实验手段,但在分泌组分析中,通常忽略其带来的非预期影响。例如,已有研究表明,即使是数小时的短时间血清剥夺,也会影响多种蛋白的表达和磷酸化状态。
Secreted protein analysis of Serum-free Media
为了规避血清蛋白的干扰问题,许多研究直接使用无血清培养基来减少样本复杂性并提高质谱鉴定率^[Expert Rev. Proteomics 2012, 9, 337]。但是,细胞在不含血清的培养基中处于“饥饿”状态,其生长和增殖受到严重影响,从而改变分泌蛋白质的组成[Nat. Biotechnol. 2012, 30, 984 ]。
饥饿状态也可能引起细胞死亡,导致细胞内蛋白质泄漏到条件培养基中,干扰分泌蛋白质组的分析^[Expert Rev. Proteomics 2012, 9, 337]。
Secreted protein analysis of Serum-containing Media
研究分泌蛋白的一个主要障碍是含血清培养基中蛋白质的极高动态范围。以最常用的含10%胎牛血清培养基为例,细胞分泌的蛋白质浓度通常比培养基中的血清蛋白质的浓度低十万倍以上。在质谱检测中,这些高丰度蛋白的存在会掩盖低丰度分泌蛋白质的信号,导致关键分泌蛋白的鉴定失败。因此,许多重要蛋白质由于丰度很低而难以通过基于质谱的蛋白质组学技术进行分析^[J. Transl. Med. 2011, 9, 113]。
为了提高质谱检测低丰度肽段的机会,可以通过色谱分级来降低样品复杂性。这种方法最主要的问题在于分析过程十分耗时。例如,Dey等人^[Clin. Proteomics 2019, 16, 16]通过二维色谱将血清样品分级得到上百个样品并进行质谱定量分析,鉴定到约5000个血清蛋白质,但是一份样品的分析时间共计>500小时。
另一种减少复杂性的方法是使用针对高丰度血清蛋白的亲和去除离心柱。目前市面上有几种不同类型的亲和柱。这些亲和柱基于能够捕获样本中高丰度蛋白质的抗体。例如,Totten等人^[Sci. Rep. 2018, 8, 6509]使用CaptureSelect亲和树脂从血浆样本中去除白蛋白、免疫球蛋白、转铁蛋白等14种蛋白质,鉴定了在前列腺癌和良性前列腺增生患者中不同的分泌蛋白。虽然亲和柱可以有效地从血清样本中去除高丰度蛋白质,但有研究表明该方法也可能导致样本损失,从而影响蛋白质的定量和重复性[Clin. Proteomics 2019, 16, 9]。这些商品柱所使用材料也可能非特异性地吸附一些分泌蛋白[Talanta 2017, 170, 199]。另一方面,由于白蛋白能与几种分泌蛋白结合[Front. Physiol. 2014, 5, 299],去除白蛋白会导致其他分泌蛋白的丢失。此外,这些亲和柱的处理能力通常较低,因此高丰度蛋白去除方法的成本效益并不高。
为了直接分析含血清培养基中的分泌蛋白,有研究团队通过化学蛋白质组学技术实现分泌蛋白的选择性富集和定量。
AHA
2012年,Jeroen Krijgsveld等报告了AHA方法^[Nat. Biotechnol., 2012, 30, 984]。该方法结合生物正交的非经典氨基酸标记(BONCAT)和细胞培养中氨基酸的稳定同位素标记(SILAC)技术,富集新合成的分泌蛋白。作者在培养基中添加含有叠氮基团的非天然氨基酸AHA,使得新合成的分泌蛋白质带上叠氮基团,再通过铜(I)催化的叠氮-炔烃环加成反应(CuAAC)与炔基亲和探针/微球反应,经过富集后鉴定和定量了超过1000种分泌蛋白。虽然该方法使用了严格的洗涤条件,但仍然存在大量血清蛋白污染。
HPG
田瑞军等[] 提出了基于炔基氨基酸类似物(HPG)代谢标记与叠氮探针富集的组合策略^[Chin J Chem 2021, 39, 1843]。与经典的基于叠氮氨基酸/单糖的代谢标记和富集方法相比,改策略显著提高了分泌蛋白鉴定的选择性。该研究还发现了经典方法中存在的血清蛋白污染问题是由于硫醇-炔烃加成反应引起的。
Proteominer
Proteominer是一种基于蛋白质浓度“均衡化”(equalization)的策略。该策略使用由组合化学生成的肽配体文库,这些配体固定在微珠上,然后与复杂的蛋白质混合物孵育。通过提供种类繁多但数量有限的结合位点,这种方法可以降低蛋白质浓度的动态范围,从而相对富集低丰度蛋白,并减少高丰度蛋白的干扰。
原理:
蛋白质中氨基酸的空间排列决定了其理化特性,例如等电点(pI)、电荷密度、疏水指数以及构象。而蛋白质的构象决定了其与其他具有互补结构分子的体内相互作用能力,这也是亲和色谱分离蛋白质的理论基础,其中相互作用分子(即配体)被化学固定在固体载体上 [Wilchek, M., Miron, T., Kohn, J., Methods Enzymol. 1984, 3–55]。被固定配体的互补蛋白可以从复杂混合物中被捕获,直到配体饱和为止。理论上,只要配体种类足够丰富,就可以为复杂混合物中的每种蛋白都找到一个相应的配体,确保所有蛋白都被吸附。
当血清等生物样本在特定的限制容量条件下接触这类配体库时,高丰度蛋白会迅速饱和其所有高亲和力配体,因此绝大多数此类蛋白将保持未结合状态。相反,痕量蛋白不会饱和其配体,从而大部分会被结合。因此,基于这种“饱和-超载”(saturation-overloading principle)原理,组合固相配体库可以富集痕量蛋白,而相对减少高丰度蛋白的比例。在去除未结合或弱结合蛋白后,从微珠上洗脱下来的蛋白混合物将具有更窄的蛋白质浓度动态范围,同时仍能代表原始样本中所有蛋白的组成。
这种配体库必须满足三个条件:
必须具有足够且可重复的配体多样性,以便结合混合物中每种蛋白;
配体与蛋白的解离常数(Kd)必须与蛋白的浓度相匹配;
配体及其固载载体必须与未分级的测试样本兼容,且具有足够的结合容量,以便捕获并检测到足量蛋白。
该技术的基础是使用多肽配体文库,使蛋白可以被吸附。其构建方法基于 Merrifield [Science, 1965, 150, 178] 首创的固相合成技术,通过“分割-偶联-重组”策略,在树脂微珠上合成多肽配体文库 [Nature, 1991, 354, 82; Int. J. Pept. Protein Res. 1991, 37, 487]。每个微珠上携带数百万份相同的独特配体,每个微珠可能携带不同配体。仅使用20种天然氨基酸,就能合成包含64百万种(20⁶)不同配体的线性六肽库。如果再加入非天然氨基酸和D-构型氨基酸,并构建成分支、线性或环状结构,该库的多样性几乎可以无限扩展,理论上可以包含与样本中每个蛋白相对应的配体。
应用于血浆蛋白分析
2005年,Lee Lomas [2005. Lee Lomas. Electrophoresis. 10.1002/elps.200500147] 将六肽文库与各种生物样本混合,一旦配体与其相应蛋白结合后,通过洗涤步骤去除未结合或弱结合蛋白,随后使用常规的色谱洗脱方法从微珠上洗脱吸附蛋白。图1展示了这一典型过程。最终,洗脱的蛋白混合物通过**一维或二维凝胶电泳(1-DE / 2-DE)和/或质谱(MS)**进行分析。
2009年,M. Quadroni使用Bio-Rad的Proteominer beads [2009. M. Quadroni*. JPR. 10.1021/pr900476b]分析含血清CM中的分泌蛋白质组。(低引文章)
Metabolic glycan labeling
由于大多数分泌蛋白都是糖基化蛋白,叠氮基糖代谢标记技术也被开发用于标记分泌蛋白,并通过环张力促进的叠氮-炔环加成(SPAAC)点击化学进行富集,最后进行质谱分析^[23]。与CuAAC富集方法相比,该方法的血清蛋白污染问题更加明显。
在定量蛋白质组学方法中,基于稳定同位素的TMT标记可以提高多肽在一级谱(MS1)中的信号强度,有助于低丰度肽段的二级谱(MS2)分析。Budnik等人^[31]首次将这种TMT-boosting方法应用于单细胞蛋白质组学分析(SCoPE-MS)。
Suttapitugsakul等人^[Anal. Chem. 2021, 93, 2694]将TMT-boosting方法与糖代谢标记方法相结合,在含血清条件下从不同细胞类型(包括单核细胞、巨噬细胞和Hep G2细胞)中鉴定到了200多种糖蛋白。
2012. Stefan F. Lichtenthaler*. EMBO J.
10.1038/emboj.2012.173
Secretome Protein Enrichment Identifies Physiological BACE1 Protease Substrates in Neurons. EMBO J. 31, no. 14 (): 3157–68.
Serdaroglu, A. et al. An optimised version of the secretome protein enrichment with click sugars (SPECS) method leads to enhanced coverage of the secretome. PROTEOMICS 17, 1600423 (2017).
2017. Peer-Hendrik Kuhn. Proteomics.
10.1002/pmic.201600423
An Optimised Version of the Secretome Protein Enrichment with Click Sugars (SPECS) Method Leads to Enhanced Coverage of the Secretome.
DBCO-sulpho-biotin 优于 DBCO-PEG12-biotin
With the new protocol, 1049 proteins were identified of which 604 are annotated to be glycosylated by UniProt (Glycoprotein, keyword: KW-0325; Fig. 2A–C and Table 1).
In contrast, using the old protocol, 646 proteins were identified of which 373 proteins are glycosylated (Fig. 2A–C and Table 1).
the number of identified glycoproteins was increased by 62%, whereas the ratio of glycoproteins to non-glycosylated proteins stayed almost constant (57% vs. 58%).
2017. Thilo Bracht. JPR.
10.1021/acs.jproteome.6b00575
Quantitative Secretome Analysis of Activated Jurkat Cells Using Click Chemistry-Based Enrichment of Secreted Glycoproteins.
DBCO-PEG4-Desthiobiotin 优于DBCO-Sulfo-Biotin
2020. Stefan F. Lichtenthaler*. EMBO J
10.15252/embj.2020105693
An Optimized Quantitative Proteomics Method Establishes the Cell Type-Resolved Mouse Brain Secretome. The EMBO Journal 39, no. 20 (2020): e105693.
Proximity Biotinylation
2021. Toren Finkel*. PNAS
10.1073/pnas.2005134118
The Secretome Mouse Provides a Genetic Platform to Delineate Tissue-Specific in Vivo Secretion. Proceedings of the National Academy of Sciences 118, no. 3 ().
ER-BioID