肽质量指纹图谱(又称肽质量指纹、PMF、protein fingerprinting 或 蛋白质指纹)是一种用于蛋白质测序与鉴定的技术。该方法中,未知目标蛋白首先被切割成较小的肽段,然后利用质谱精确测量这些肽段的绝对分子质量 [10.1021/ac9810516]。
该方法最早由多个研究小组于 1993 年独立开发 [10.1016/0960-9822(93)90195-T][10.1073/pnas.90.11.5011][10.1002/bms.1200220605][10.1006/bbrc.1993.2009][10.1006/abio.1993.1514]。其核心思想是将获得的肽质量与包含已知蛋白序列的数据库或基因组信息进行比较。计算机程序可将生物体的基因组翻译为蛋白质序列,并理论上模拟蛋白质的酶切过程,计算所得肽段的理论质量。随后,将未知样品中肽的实测质量与数据库中理论肽质量进行比对,并通过统计分析找出最佳匹配结果。
该方法的主要优点是只需获得肽段的质量信息即可进行蛋白质鉴定;但也存在局限性,例如目标蛋白的序列必须包含在数据库中。此外,大多数 PMF 算法假定肽段来源于单一蛋白质 [10.1073/pnas.93.25.14440],因此混合样品会显著增加分析复杂性并降低准确度。为了实现高特异性鉴定,PMF 通常需要在分析前对蛋白质进行充分分离。超过 2–3 种蛋白质的混合物往往需要结合基于 MS/MS 的方法进行进一步确认,例如 MALDI-TOF/TOF 或凝胶点洗脱后的 nanoLC-ESI-MS/MS 分析 [10.1073/pnas.93.25.14440][10.1186/1477-5956-1-6]。
起源
由于传统蛋白质分析过程冗长且繁琐,PMF 技术应运而生。在 PMF 发展之前,Edman 降解是主要的蛋白质测序方法,但分析一个氨基酸残基大约需要一小时 [10.1016/S1044-0305(03)00214-9]。此外,SDS-PAGE 被广泛用于复杂混合物中蛋白质的分离,并结合电印迹及染色方法 [10.1016/S0021-9258(18)61070-1]。随后,蛋白条带可从凝胶中提取并进行自动测序,但常出现干扰蛋白与目标蛋白共纯化的问题。这些干扰蛋白的序列后来被编入 Dayhoff 数据库 [10.1146/annurev.bb.12.060183.002223],用于后续分析中排除常见污染物,从而减少仪器时间并降低分析成本。
样品制备
蛋白质样品可来源于 SDS-PAGE [10.1073/pnas.93.25.14440] 或反相 HPLC,随后进行必要的化学修饰。在电泳过程中,蛋白质中的二硫键被还原,半胱氨酸残基通常通过氨甲基化或丙烯酰胺化处理。
接着,利用蛋白水解酶(如胰蛋白酶、糜蛋白酶或 Glu-C)将蛋白质切割成多个肽段。典型的蛋白与酶比例为 50:1。蛋白水解通常在过夜条件下完成,所得肽段通过乙腈提取并真空干燥后,溶于少量蒸馏水中,或进一步浓缩纯化以备质谱分析。
质谱分析
经酶解的蛋白质可使用不同类型的质谱仪进行分析,如 ESI-TOF 或 MALDI-TOF。其中,MALDI-TOF 因具有高通量优势而成为常用仪器;若结合 MS/MS 分析,可在一次实验中识别多种蛋白。LC/ESI-MS 与 CE/ESI-MS 也常用于 PMF 分析 [10.1021/ac980723p][10.1002/elps.201200066]。
样品制备时,将约 1 μL 的肽溶液转移至 MALDI 靶板上,并加入 MALDI 基质(如芥子酸、α-氰基-4-羟基肉桂酸或 2,3-二羟基苯甲酸)。基质与肽分子在靶板上共结晶,形成可供分析的样品。干滴法 是最常用的样品制备技术 [10.1016/j.ymeth.2004.08.015]。
在 MALDI 质谱分析中,脉冲激光束将能量传递至基质分子,使其携带肽段解吸、电离并进入气相。离子在电场中加速,通过飞行时间(TOF)管到达检测器,其到达时间与质荷比成正比,由此可计算肽段的分子质量。
ESI 与毛细管 LC 联用可同时实现肽段分离与分子量测定 [10.1002/0470118490]。此外,毛细管电泳-ESI-MS 在分析微量蛋白样品时也表现出良好性能 [10.1002/elps.201200066]。
计算分析
质谱分析会生成一组分子量数据,通常称为“峰列表”。这些肽质量随后与包含蛋白质序列的数据库(如 SwissProt)进行比较。软件使用与实验中相同的酶(如胰蛋白酶)对数据库中蛋白质进行“计算机消化”,生成理论肽段并计算其质量。程序将理论值与实验峰列表匹配,并通过统计分析输出最可能的候选蛋白。