2024年9月号 (#118)

今月のブログは、保持時間とフラグメンテーションスペクトル予測を利用したペプチド同定数の増加についてです。Mascot Server 3.0に搭載予定の新機能です。

今月の論文は、ウイルスの非標的同定に関する研究です。

今月の小技は、Mascot Server 3.0のリリースについてです。

Mascotニューズレターのバックナンバーはこのページ(英語版日本語版)からご覧いただけます。ご一読の上、ご意見・ご質問等ございましたら、お気軽にお問い合わせください。

機械学習による結果の向上

現在ベータテスト中のMascot Server 3.0では、最新の計算技術を使って保持時間とフラグメント強度の予測と、その。予測された情報を使った”feature”と再スコアリングの結果は、正しいマッチと正しくないマッチの分離に使用され、ペプチドとタンパク質の同定を向上させます。予測は、Mascot Serverに統合された、”MS2Rescore” によって計算されます。新バージョンのリリースにより、MASCOTはMS2Rescoreをプログラムの一部として組み込みます。

MS2Rescoreはゲント大学で開発されました。"AIアシストによる、ペプチド同定の再スコアリングを提供する、ユーザーフレンドリーなプラットフォームあるいはモジュール"です。内部に2つの予測システムが含まれています。「DeepLC」は、"ディープラーニングを採用した(修飾)ペプチドの保持時間予測アルゴリズム "です。そして「MS2PIP」は、"複数のフラグメンテーション法、装置、ラベリング技術に対応した、高速で正確なペプチドフラグメンテーションスペクトル予測アルゴリズム"です。どちらも、学習ステップでは見られない可変修飾に対しても正確な予測を行うことができるのが特徴で、その点で他の多くの機械学習モデルとは異なります。

酵母に少数のタンパク質がスパイクされたサンプルを検証用のデータとして選び、MASCOTで検索を行いました。MS2Rescoreを使用したMascot Server 3.0の結果は、Mascot Server 2.8の最適化された結果と比べ17%多いペプチドと13%多いタンパク質を同定しました。そしてMascotには機械学習アルゴリズムを適用した結果が詳しく検証できるように、機械学習に関する質を評価するレポートを表示させる事ができます。「アルゴリズムに対して正しいモデル(パラメーター)を選択したか?予測内容は正しいのか?」という疑問を検討する事が可能です。

Mascot Server 3.0に搭載される新しい機械学習機能については、ブログ記事(英語版日本語版)をご覧ください。

液体クロマトグラフィーとタンデム質量分析を組み合わせた、プロテオタイピングによる病原ウイルスの全般的な同定

Universal Identification of Pathogenic Viruses by liquid chromatography coupled to tandem mass spectrometry Proteotyping

Clément Lozano, Olivier Pible, Marine Eschlimann, Mathieu Giraud, Stéphanie Debroas, Jean-Charles Gaillard, Laurent Bellanger, Laurent Taysse, Jean Armengaud

Molecular & Cellular Proteomics, published online July 29, 2024

著者らはサンプル中のウイルスを非標的で同定する方法を開発しました。この方法では唾液サンプルから磁気ビーズを用いてタンパク質を抽出し、その後ペプチド消化とLC-MS/MSを行います。

分類学的なウイルス同定は、段階を経た(訳者注:検索対象となるデータベースの中身について、生物の分類的に段階を経た、の意味。)MASCOT検索によって実施されました。最初のステップでは、10,000の最良なMS/MSスペクトルを選択し、NCBInrデータベースの一部をまとめたデータベースに対して検索が実行されます。このデータベースのサブセットは、50,995生物種からなり、1生物種につき1つの代表生物で構成されています。(494 Archaea、2231 Eukaryota、12,047 Bacteria、36,223 Viruses)。2番目のステップでは、1番目のステップで同定された生物の「属」とその下流に当たる種に属する生物のデータベースに変更します。測定データすべてのMS/MSスペクトルを、この縮小データベースに対して検索を行いました。そして最後のステップでは、すべてのMS/MSスペクトルを、2番目のステップで同定された生物種のみで構成されるデータベースに対して再び検索しました。

著者らはこのアイデアが実際に適用可能かどうか、検証を行いました。公開されているショットガンプロテオミクスのデータの中で、感染者のウイルス調製物から得る事が可能なデータを選別し利用しました。その結果、53の公開データセットから、異なる23種のウイルスの同定に成功しました。また、4人の健康なドナーから採取した唾液サンプルにワクシニアウイルスをスパイクしこの方法で分析したところ、全てにおいてウイルスを検出する事ができ、偽陽性も示しませんでした。さらにこの方法について検証したところ、3つの近縁のアルファウイルス: Pixunaウイルス、Rio Negroウイルス、Sindbisウイルス、を識別して同定することができました。全体として、この方法は感度87.9%、特異度79.6%という性能を示しました。

Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

MASCOT Server 3.0 を入手しよう!

Illustration for Mascot

Mascot Server 3.0は現在ベータテスト中です。9月末までにリリースする予定で、日本では日本語による各種資料を準備の上さらにその2週間後を目途にリリースいたします。保守契約を結んでいるお客様には、新バージョンを無償でご提供いたします。

新たに搭載される機能についてはこちらをご覧ください。

リリース前にver.2.8の段階で購入された場合でも、購入時に付与されている1年間の保守契約によりMascot Server 3.0を入手する事ができます。Updateのタイミングによっては3.0リリース後にバージョンアップを購入するよりもお得です。詳しくは弊社までお気軽にお問合せ下さい。最も安くお得な選択肢をご案内いたします。

お問い合せ

マトリックスサイエンス株式会社

〒110-0015

東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

Matrix Science logo