算法
交联肽段鉴定算法可以根据支持的交联剂类型进行细分,这些交联剂可以是质谱可裂解的或非可裂解的。
鉴定算法必须在搜索空间中包含不同的交联产物以及单个肽段,这大大增加了复杂性,相比传统蛋白质组学具有更高难度。
非可裂解交联剂的两个问题
在使用非可裂解交联剂的研究中,任何肽段都可以与任何其他肽段连接,这导致搜索空间增加,被称为 N² 问题。
二次搜索空间(n²问题)可以通过策略减少到线性搜索空间(2n问题)。

Reduction of search space for MS-cleavable cross-linkers. After MS selection of a cross-linked product as a precursor ion, the masses of the connected peptides can be inferred from the fragment ions created in MS/MS experiments.
许多软件(如 StavroX 和 OpenPepXL)使用穷举搜索方法来处理这个空间。因此,不可裂解的交联剂通常用于较小的蛋白质集合或复合体。
一些算法采用不同方法解决搜索空间问题:
除了搜索空间挑战之外,不可裂解交联肽可能显示两个肽的碎片离子分布不均。使用 MS 可裂解交联剂 可以规避这两个问题,使 XL-MS 应用甚至扩展到整个蛋白质组。
与不可裂解、非标记交联剂联合使用的算法包括 pLink、StavroX、Xi 和 Kojak。
可质谱裂解交联剂
MS 可裂解交联剂的不稳定键断裂产生带有特定交联剂部分的单肽,产生独特特征离子。在特征峰和相应前体的帮助下产生候选交联肽,并对实验谱图评分。
Software for Analyzing Cross-links
计算能力的快速进步缓解了 XL-MS 方法的瓶颈,即对数据的快速高效分析。虽然理想情况下希望有通用流程,但迄今为止几乎每个团队都依赖定制软件。
表 1. XL-MS 数据分析工具
横向评测:
对比:pLink > StavroX、Xi [10.1038/s41467-020-14608-2]
对比:MaxLynx > pLink2 > OpenPepXL, Xi > StavroX [10.1021/acs.analchem.1c03688]
Software for Visualizing Cross-links
软件工具的多样性导致了多样的数据输出格式。一些搜索引擎支持直接可视化导出,例如 MeroX 提供 xVis 和 xiView,并允许加载 PDB 文件以确定交联距离。
CroCo [10.1093/bioinformatics/btz732] 可将不同搜索引擎(Kojak、MeroX、pLink、Xi)输出转换为兼容可视化工具的数据。
表 2. XL-MS 可视化软件
FDR Estimation
XL-MS 数据集的 FDR 估计比传统蛋白质组学复杂,因为交联剂将两个肽段共价连接 [10.1038/nmeth.2103]。通常使用 target-decoy 方法:

FDR 受数据库大小、decoy 数据库性质和 XL-MS 软件评分算法影响 [10.1074/jbc.M207370200]。
可在不同层次计算 FDR:交联谱匹配(CSM/XSM)、残基对或蛋白质对 [10.1021/acs.analchem.6b03745]
肽内与蛋白间交联需区分;蛋白间交联假阳性概率更高 [10.1074/mcp.M113.034009]
可通过经验性得分截断改进 FDR [10.1021/acs.jproteome.9b00085]
常用软件内置 FDR 计算:pLink、StavroX、Xi、MeroX、XlinkX
Kojak 可通过外部工具 Percolator [10.1007/s13361-016-1460-7] 或 PeptideProphet [10.1021/pr070542g] 估计 FDR。
Mapping Cross-links on Protein Structures
交联通常映射到蛋白质数据库中的 3D 结构(X-ray、cryo-EM 或 NMR) [10.1038/s41592-020-0959-9]。
异源多聚物交联距离通常高于同源多聚物
超过50%的交联可在 3D 结构中匹配,其余位于柔性区域或 IDRs
欧氏距离和基于溶剂可及表面的距离均可使用 [10.1016/j.str.2018.04.016, 10.1093/bioinformatics/btr348]
交联帮助识别柔性区域、构象变化及结合蛋白的化学计量变化 [10.1038/s41598-020-69313-3]。
Modeling of Protein Complexes
XL-MS 数据可与大分子对接(macromolecular docking)结合进行建模:
对接主要瓶颈:绑定构象采样 + 评分函数 [10.1002/prot.10115]
可通过随机移除数据或加权函数克服约束违规 [10.1021/ja026939x, 10.1007/978-1-4939-9608-7_15]
建模软件:HADDOCK [10.1016/j.jmb.2015.09.014]、Rosetta [10.1038/s41592-020-0848-2]、IMP [10.1007/978-1-4939-9608-7_15]
每个交联转化为距离约束,可调整势能函数和加权参数 [10.1021/ja026939x, 10.1038/s41596-018-0017-6]
可使用 MD 模拟优化结构 [10.1002/prot.24210]
Large-Scale Modeling of Proteomes
系统范围 XL-MS 分析仍然具有挑战性 [10.15252/msb.20167412]:
PDB 中结构可能缺失,需要基于模板或预测生成蛋白质组分子模型
AlphaFold [10.1038/s41586-019-1923-7]、Rosetta [10.1038/s41467-019-11994-0] 及 Pfam [10.1093/nar/gkaa913] 提供高质量预测
CAPRI 对接进展可提供高可信度 PPI 结构 [10.1002/prot.25215]