ProteoWizard MSConvert 质谱文件格式转换 踩坑指南(mac版)
ProteoWizard 是一套用于蛋白质组学数据分析和转换的开源软件工具,其中 msconvert
是其最为常用的工具之一。msconvert
主要用于质谱数据的格式转换,它支持从多种质谱数据格式转换为其他格式,特别是将原始厂商格式的文件(如 Thermo Fisher 的 .raw
文件)转换为开放格式,如 mzML、mzXML 或 MGF 等。以下是一些关于 msconvert
的关键点:
主要特性
-
格式转换:
msconvert
支持多种质谱数据格式之间的转换,包括将厂商特定的原始格式转换为通用的、开放的标准格式。 -
数据处理:在转换过程中,
msconvert
可以进行一些数据处理步骤,如峰值拾取(peak picking)、去噪、滤波等。 - 灵活性:用户可以通过命令行参数自定义转换过程,选择不同的输出格式和应用各种数据处理选项。
- 兼容性:它广泛支持多家质谱仪生产商的数据格式,包括 Thermo Fisher、Bruker、Waters 等。
使用场景
- 数据共享:转换为开放格式后,数据更容易在不同研究组之间共享,也更容易用于各种质谱分析软件。
-
数据分析:某些质谱分析软件可能不支持特定厂商的原始格式,使用
msconvert
转换使其与这些工具兼容。 - 数据存档:将数据转换为标准开放格式,有助于长期数据存档和未来的数据重用。
注意事项
-
软件安装:
msconvert
是 ProteoWizard 软件包的一部分,需要从 ProteoWizard 官网下载并安装。 - 操作系统兼容性:ProteoWizard 支持 Windows、macOS 和 Linux,对Windows比较友好。
- 许可和兼容性:尽管 ProteoWizard 是开源的,某些原始文件格式的读取可能需要遵守相应厂商的许可协议。
MSConvert的Linux版本和mac版本不友好,需要使用docker操作。可惜我使用Windows的MSConvert可视化界面版本一直显示无权限,只能继续用mac
注:mac的M1芯片无法执行,下面为Intel芯片的结果
(1)安装homebrew
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
(3)安装docker
brew install --cask --appdir=/Applications docker
(3)准备文件
将.raw后缀格式的文件放在目录下,我的是 /Users/henson/Desktop/0225/,里面放置了GAST001.raw
(4)执行转换代码,得到的结果会放在输入文件目录中
docker run -it --rm -e WINEDEBUG=-all -v /Users/henson/Desktop/0225/:/data chambm/pwiz-skyline-i-agree-to-the-vendor-licenses wine msconvert /data/GAST001.raw
其中语句解释如下:
-v /Users/henson/Desktop/0225/:/data: 将本地目录 /Users/henson/Desktop/0225/ 映射到 Docker 容器内的 /data 目录。现在,容器内的 /data 目录包含了您的 GAST001.raw 文件。
wine msconvert /data/GAST001.raw: 这条命令告诉 Docker 容器内的 Wine 环境运行 msconvert 并转换 /data 目录中的 GAST001.raw 文件。
ps:如果是多个输入文件,最后一个参数改为/data/*.raw 即可