チュートリアル : Mascot Distillerのカスタムレポートを作成する
Mascot Distiller 2.8のレポート機能は、一般的に使用されているプログラミング言語であるPythonで記述されています。検索結果・定量解析結果に対して、Mascot Parserを介してアクセスします。以前のブログ記事(英語版、日本語版)でも紹介したように、Distillerでは、データの質、クラスタリング、統計解析など、さまざまな標準レポートを提供しています。それに加え、ユーザーが独自のレポートを作成し、Mascot DistillerのGUIから直接実行することも、コマンドラインにおいて実行させる事も可能です。
カスタムレポートを作成するためには、プログラミング言語のPython 、Mascot Parserライブラリ、そしてVisual Studio Codeなどの統合開発環境(IDE,Integrated Development Environment)の知識が必要です。
Mascot Distiller 2.8にはPython 3.6が組み込まれており、データの操作や書式設定、グラフの作成、カスタムフォーマットでのエクスポートなどの他、http経由での他のシステムへのアップロードなども使用できる便利な追加ライブラリが多数含まれています。具体的には以下の通りです:
- Mascot Parser : Mascotの検索結果・定量解析結果にアクセスするためのライブラリ。弊社にて開発。
- Statsmodels : 検定を行うためのライブラリ
- Plotly : Javascriptを使用してユーザーとのやりとりが可能なグラフ作成ライブラリ
- SciPy : 科学計算のためのアルゴリズムライブラリ
- NumPy : 配列の作成と操作を行うライブラリ
- pandas : データ解析・操作用ライブラリ
- matplotlib : グラフ作成・可視化ライブラリ
- scikit-learn : 機械学習ライブラリ
- seaborn : matplotlibをベースとした、データ可視化ライブラリ
これらのライブラリを適用すれば、ほとんどすべての種類のレポート作成と視覚化が可能なはずです。
Distiller Pythonレポートの開発を簡単にするために、いくつかの補助スクリプトも提供しています。補助スクリプトはMASCOT Distiller インストールフォルダの中にある「reports」フォルダにあります。
- LoadQuantitation.py : 検索・定量結果をmsparserにロードし結果を返すメソッドを含みます。計算結果にアクセスするために必要なステップを減らす事ができます。
- CreateQuantDataFrames.py : タンパク質やペプチドの定量データをリストや配列にロードするメソッドを含みます。
- WriteReports.py:スクリプトからMascot Distillerにログや進捗情報を出力するメソッドを含みます。
Mascot Distillerに付属しているPythonを開発環境として選ぶと、Distiller GUIで使用可能なランタイムライブラリにスクリプト経由でアクセスできるようになります。ライブラリにアクセスするためには、Mascot Distillerをインストールしたディレクトリの "python-3.6.5-embed-win-amd64″にあるpython実行ファイルを、IDEのPython環境として選択してください。IDEにその方法が記載されているはずです。もし開発を別のPCで行っている場合、そのコンピューターでMascot Distillerをインストールしてください。ライセンスは不要です。Pythonが組み込まれたビューワーモードとしてMascot Distillerがインストールされ、その環境においてもカスタムレポートの開発とテストが可能になります。
Distillerのレポート機能は、レポートの入力を定義するXMLファイルとPythonスクリプトの2つのファイルで構成されます。XMLファイルは、ドロップダウンメニューやチェックボックスのような、 GUIの Wizard インターフェースのコントロールをオプションとして定義する事もできます。レポートXMLを定義するスキーマファイルは、Mascot Distillerワークステーションの “C:\ProgramData\Matrix Science\Mascot Distiller\schema\distiller_report_definition_1.xsd”です。スキーマファイルは完全にドキュメント化されていますが、ご不明な点がありましたらsupport-jp@matrixscience.comまでご連絡ください。
私たちはPythonレポートを作成し、Mascot Distiller上で有効にするために必要な手順を説明するためのチュートリアルを作成し公開しています。チュートリアルで説明するサンプルスクリプトは、全サンプル成分の平均(上位3位)タンパク質強度を計算し、CSVエクスポートファイルを生成します。このレポートはMascot Distillerの次のリリースに含まれる予定です。 チュートリアルのPDFとレポートスクリプトファイルは以下のところからダウンロードできます:
Keywords: Mascot Distiller, Python, quantitation, reports, tutorial