internal fragmentsのマッチング考慮によりHCD の検索結果が改善されます
Mascotには、マッチングとスコアリングに使用するフラグメントイオンのシリーズを定義するいくつかの「instrument」項目の設定が予め準備されています。 すべてのinstrument設定でbイオン、ほとんどの設定でyイオンが使用でき、ETD-TRAPのようにcと z+1も使用できる設定もあります。Mascotではa/bタイプとyタイプ、2回のバックボーン切断が組み合わさったinternal fragments(内部フラグメント)もマッチングに考慮する事ができます。デフォルトの設定内容のうち、internal fragmentsnの考慮が有効になっているのはMALDI-TOF-TOFとMALDI-TOF-PSDのみです。しかしそれ以外のケース、例えばHCDでinternal fragments を考慮した検索を行った場合、特に段階的なコリジョンエネルギーを採用しているケースでは大幅な改善が期待できます。
今回ご紹介する例はCold Spring Harbour LaboratoryのDarryl Pappin博士の好意により提供された内容です。Thermo Exploris 480のstep collision energy modeで測定したHeLaの標準的なQCインジェクションです。このデータについて、Darryl博士は以下のように述べています:
データは、HCDのコリジョンエネルギー(%)30、35、40の3段階の設定で測定しました。2016年にOrbitrap Lumosを入手した当初は、HCDの通常範囲の高い方のコリジョンエネルギーを使用していました。この設定は大きなペプチドやいくつかの翻訳後修飾の解析において実に良い結果が得られました。リン酸化ペプチドの解析ではフラグメントが混在するのではなく、ほとんどすべてのケースで -80または-98のニュートラルロスのイオン系列が見られました。また高いコリジョンエネルギーでは、かなりの数のinternal fragmentイオンが得られるようでした。
ここ数年我々はこの3段階コリジョン体制を使っています。この方法を行うのに必要な追加時間は、MS2を1回測定する時間より5%ほど多いだけで、それほどロスがなく効率的です。フラグメントは各エネルギーレベル間で分割されるため1つのエネルギーレベルだけで衝突させた場合よりもピークは少し小さくなりますが、総合的に見ればinternal fragmentを見るのに良い組み合わせです。
Darrylはまた、internal fragmentイオンはクロスリンクの研究において有用であると報告しています。この解析では全体的なフラグメンテーションがまばらであることが多いのですが、内部フラグメンテーションが2つの架橋ペプチドのどちらか一方に限定された情報である事が多く、解析に有利に働く良い証拠となるケースがあります。
今回ご紹介するQCインジェクションデータは81,267クエリーで、高分解能な(FT)MS1とMS2から構成されるデータです。ピーク抽出はMascot DistillerでデフォルトのThermoオプションを使用して行いました。装置のキャリブレーションが順調であったこともあり、プリカーサーのトレランスは5ppm、フラグメントのトレランスは10ppmに設定されています。
下の表は、internals fragmentsのマッチングを考慮した場合の影響をまとめたものです。yaと ybシリーズを有効にするだけで、1%PSM FDRで16%、ペプチド配列は13% 同定数が増えました。
Search | Target PSMs | PSM FDR | Target sequences |
Seq. FDR |
---|---|---|---|---|
ESI-TRAP | 13632 | 1.00% | 4355 | 0.90% |
ESI-TRAP with internals | 15874 | 1.00% | 4918 | 1.10% |
手法の適用前は同定基準以下(統計的に有意でない)であった多くのマッチが、適用により基準以上のスコアとなるケースが増え、同定されたユニークなペプチドあるいはPSMの数の両方が増加しました。
Internal fragmentsを有効にすると検索時間が長くなると思われるかもしれません。しかし今回のように規模の小さな検索では、検索時間はどちらもほぼ変わりませんでした。検索スペースに長いペプチドが多い場合、internal fragmentを考慮すると、使用しない場合よりも検索に少し時間がかかると思われますが、それでも検索時間が数パーセント長くなる程度です。
MS/MSの実測スペクトルと理論値データとのマッチングの際、MascotはMS/MSの実測スペクトルを100Daのウィンドウに分割し、ピーク強度のランク順にマッチング対象となるピークを選択します。そしてもう1点、強度の高いピークが理論値データにマッチしない場合、Mascotは説明できないピークの強度の合計に比例したペナルティを課します。internal fragmentを考慮しない場合にこのペナルティが課されていたピークが、考慮するとペナルティとしてカウントされず、結果的にスコアが向上します。
上図のQuery 57256はその好例です。選択されたピークの数はどちらも同じです("51 most intense peaks")。internal fragmentを考慮しないケースでは13のピークが「余分なピーク」とみなされペナルティの対象でしたが、Internal fragmentの考慮を有効にすると、「余分ではないピーク」とラベル付けされ、ペナルティは課されません。Peptide summaryで表示されるSpectrum Viewerでは該当ピークは黄色のラベルで表示されます。これにより、スコアは57から71になります。
もう1つの例として、Query 70020もご紹介します。こちらのケースではinternal fragmentsを考慮することで、Mascotが「スペクトルをより深く掘り下げる」事ができました。このアルゴリズムは21個の新しいinternal fragmentイオンを発掘したのみでなく、ペナルティがなくなったことでマッチング評価がよりスムーズになり、bと yのピークも追加で検出する事ができました。すなわちinternal fragmentsを考慮していない検索のケースではinternal fragmentsピークの強度が高いにも関わらずマッチしていない事が悪影響を与え、100Daのウィンドウのランク付けとマッチングにおいてbやyのピークが選ばれないまま検索が終わってしまう、いわばbやyピークが「マスク」された状態でした。
似たようなケースは他にもたくさんあります。また、Query 56567のようにスコアが変わらないケースもいくつかあります。上記で説明したようにinternal fragmentsはノイズペナルティを減らすことによってのみプラスに働きます。あくまでもオプション的な位置づけのフラグメントであり、マッチそのものはプラスでなく、マッチしない事についてマイナス面での影響はありません。
最後に、Thermo Proteome Discovererのような別のソフトウェアを通してMascotを使用しているケースでinternal fragmentを考慮した検索を行いたい場合、まず考慮したいフラグメントの組み合わせが初期設定になければMascotのConfiguration editorで「instrument」を開いて設定を作成してください。そして検索時に、パラメーター”instrument”にて設定項目を選んでください。一方別のソフトウェア側でこれらの設定を利用した検索結果を取り込むのに必要な追加設定は特にないはずです。
Keywords: configuration files, fragmentation, ion series, scoring