由于额外的离子迁移维度以及极高的原始数据点数量,timsTOF PASEF 数据分析面临显著挑战。
dda-PASEF 数据分析
MaxQuant 是首批广泛支持 dda-PASEF 数据的蛋白质组学分析工具之一[10.1074/mcp.TIR119.001720]。
它将四维 MS1 特征(m/z、保留时间、离子迁移率与强度)组装在一起,并基于前体质量和迁移率自动分配相应的 PASEF 谱图。
已有的质量重新校准程序被扩展到额外的迁移维度,使得可在 ≤10 ppm 的前体质量容差下进行数据库搜索,得到的肽段质量中位绝对偏差约为 1–1.5 ppm。
顺带一提,这些数值与无 TIMS 的 impact II QTOF 仪器相似 [10.1074/mcp.M114.047407],而根据瞬态长度不同,Orbitrap 仪器在蛋白质组学中可实现约 0.5 ppm 的更高质量精度。
尽管目前离子迁移率尚未被纳入肽段谱图匹配的评分中,但通过跨实验对齐迁移率数值,可提高“跨样品匹配(matching between runs)”的置信度,从而支持无标记定量中在未发生碎裂事件的 LC 运行中转移鉴定结果。
借助碎片离子与峰索引(fragment ion and peak indexing),MSFragger 及其配套的 IonQuant 实现了数倍更快的处理速度,使得**半特异性(semispecific)与开放数据库搜索(open search)**成为可能[10.1074/mcp.TIR120.002048] 。
同一研究组还实现了一种“跨样品匹配”算法的变体,将离子迁移率等数据输入机器学习模型,以区分真匹配与假匹配 [10.1016/j.mcpro.2021.100077]。
除学术工具外,商业软件对 TIMS 数据的支持也在不断增强,例如 PEAKS 和 SpectroMine。
Mann 研究组还开发了一个名为 AlphaTIMS [10.1016/j.mcpro.2021.100149]的工具,该工具在 Python 中引入了一种极高效的数据结构,可直接用于可视化和处理原始数据的全部细节,而无需事先进行聚合。
AlphaTIMS 是开源框架 AlphaPept 的一部分,后者支持对 timsTOF 数据的稳健且快速的处理[10.1038/s41467-024-46485-4]。
dia-PASEF 数据分析
通过**并行反应监测-PASEF(PRM-PASEF)**获取的靶向蛋白质组学数据可使用 Skyline 进行处理,该软件同时支持 dia-PASEF 实验的全蛋白质组分析。
最初的 dia-PASEF 研究在论文中详细说明了将 DIA(数据非依赖采集) 的靶向数据分析原理 [10.1074/mcp.O111.016717] 扩展到新数据格式的过程,并在 OpenSWATH [10.1038/nbt.2841]环境中开发了开源工具包 Mobi-DIK [10.1038/s41592-020-00998-0]。
在数据处理过程中,离子迁移维度用于限制数据提取窗口,同时提取多个基于迁移率的评分指标。
与对 HeLa 样本的朴素分析相比,这种方法使得可鉴定的前体数量增加了 20% 以上。
Spectronaut 提供了基于谱图库和无谱图库分析的流行商业解决方案。
近年来开发的 DIA-NN 软件利用神经网络将 MS/MS 数据与谱图库匹配,并已扩展支持 dia-PASEF。
使用 MSFragger 生成的谱图库重新分析原始 dia-PASEF 数据时,DIA-NN 显著提高了蛋白质鉴定数量与定量精度——在 5 分钟 EvoSep 运行中可鉴定超过 5000 种蛋白质 [10.1038/s41467-022-31492-0]。
通过 MaxDIA,如今可在 MaxQuant 环境中直接分析 dia-PASEF 数据 [10.1038/s41587-021-00968-7]。
总体而言,针对 TIMS–PASEF 数据的软件解决方案数量正在不断增加,这将有助于该技术的更广泛应用并加速其发展。