著者 : Ville Koskinen   2024年6月11日 投稿のブログ記事 (元の英文記事へのリンク)

ASMS 2024 におけるMatrix Scienceの発表内容

カリフォルニア州アナハイムにおいて、2024年6月2日から6日までASMS 2024 Conferenceが開催されました。毎年恒例のブレックファストミーティングだけでなく、私たちのブースでも多くのユーザーにお会いすることができました! Conferenceでは3つの発表を行いました。ご参加いただけなかった方、あるいは発表された内容を復習されたい方に向け以下に講演内容の要約を掲載いたします。是非ご覧ください。また、ワークショップのページからスライド全文と講演者ノートをダウンロードすることができます。

Mascot Server 2.9

Mascot Serverの次期バージョンは開発サイクルの最終段階にあり、近日中に2.9ベータ版をリリースする予定です。 次回リリースで搭載予定の機能をご紹介します。

機械学習アルゴリズムの採用
様々な分野で機械学習アルゴリズムの利用が提唱されています。MASCOTにはどのように役立たせることが出来るか、私たちは考えました。Mascotの次のバージョンでは、ゲント大学のCompOmicsラボで開発されたMS2RescoreをMASCOTと統合します。MS2RescoreはAIアシストによるペプチド同定の再スコアリングを実行します。MS2Rescoreはユーザーフレンドリーでモジュール化されたプラットフォームで、保持時間予測のDeepLCとMS/MSスペクトル予測のMS2PIPを統合しています。MASCOTの結果画面:Protein Family Summaryのフォーマットコントロール部分にドロップダウンメニューを追加し、MS2Rescore を利用できるようにするとともに、LCと質量分析計の内容に合わせたモデルを選択できるようにしました。実行ボタンをクリックするとMascotがバックグラウンドで計算を行い、その結果を反映させたレポートを作成します。

Controls for MS2Rescore in Protein Family Summary

より高速なError Tolerant検索
MascotのError Tolerance(ET)検索は2段階検索です。1回目は通常の検索を行い、2回目の検索において検索空間を広げて非特異的な切断パターンと予期しない修飾を考慮した探索を行います。現在のバージョンでは、ET検索の2段階目の検索ではUnimodデータベース内の2000以上の修飾をすべて検索するため、検索に時間がかかります。新しいバージョンでは、検索時に検索対象とする修飾のサブセットを選択できるようになります。例えば、N-グリコシル化のみ、または化学誘導体のみ、といった選択ができます。これにより検索がより速くより正確に実行できます。

検索結果ファイルのパフォーマンス
Mascotではデータベースの検索結果を、長年にわたり拡張子.datのテキストベースのファイルに保存してきました。しかしMascot DistillerおよびMascot Serverのインタラクティブレポートの処理速度におけるボトルネックを解決するため、ver.2.9では検索結果の新しいファイル形式を導入します。Mascot Search Results (MSR)フォーマットは、リレーショナルデータベースの構造を持つSQLiteファイルです。ユーザーは、.dat/.msr 新旧両方の形式で検索結果をダウンロードすることができます。

‘Quality of life’の改善、バグ修正
バグ修正並びに、ちょっとした‘Quality of life’、使い勝手の向上があります。詳細はアップデート時に公開されるリリースノートのリストをご覧ください。

堅固な前バージョンとの互換性
Mascot Server 2.9は、堅固な前バージョンとの互換性、を継承しています。私たちはMASCOTにおいて、新しいバージョンにアップデートしても既存のパイプラインやワークフローが正常に動作することを大事なテーマとと捉えています。新しいバージョンでも以前のバージョンで行った検索結果を開くことができ、すべてのクライアントAPI(Application Programming Interface)は変わりません。パイプラインで旧形式(.datファイル)の結果が必要な場合も、これまで同様クライアントAPIから利用できます。Mascot CSV、Mascot XML、mzIdentML、mzTab など、サポートされているすべてのフォーマットでデータをエクスポートできます。

Mascot Distillerによるカスタムレポート

Mascot Distiller 2.8には、ANOVA、階層クラスタリング、K-meansクラスタリング、PCA、ボルケーノプロットなど、14の定量レポートが同梱されています。レポートの出力内容はPythonで定義されており、レポートを簡単にカスタマイズすることができます。プレゼンテーションではレポートの新規作成やカスタマイズについて、基本的な仕組みとどのように始めればよいかについて説明しました。レポートのユーザーインターフェイスはXMLファイルとして定義され、ファイルで定義されたレポートはDistillerがレポートメニューに追加します。 Pythonスクリプトは、計算・グラフのプロット・ファイルの保存・外部プロセスの呼び出し、などを自由に行うことができます。 スライドに加えて、チュートリアルの全文とサンプルコードは「Tutorial: Creating custom reports in Mascot Distiller(英語版日本語版」にあります。

Mascot Daemon Export Extenderを使用したレポートの自動実行

見落とされがちですが、Mascot Daemonには「Task」の前後に自動的にアクションを実行させる機能「External Processes」があります。DaemonはTask実行の後に任意のコマンドラインプログラムを実行することができますが、非常に柔軟に様々な設定に対応できる反面、多少複雑です。そこで、Taskの最後にDistillerレポート出力を自動的に実行することが非常に簡単にできる「Mascot Daemon Export Extender (MDXE)」と呼ばれる補助プログラムを作成しました。MDXEについて詳しくはこちらの資料(英語版日本語版)で説明されています。


Keywords: , , , ,