今月のブログは、検索結果をmzIdentML 1.2フォーマットでファイル出力する機能についてのご紹介です。
今月の論文は、細胞外小胞を分析することで、残留マラリア原虫に関するバイオマーカーを探索するアプローチに関する研究についてのご紹介です。
今月の小技は、Mascot Server 2.8.2のご紹介です。UniProt proteomeデータベースのダウンロードに関する問題が修正されています。
Mascotニューズレターのバックナンバーはこのページ(英語版、日本語版)からご覧いただけます。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。
Mascot Server 2.8.1では、検索結果をPSI(Proteomics Standards Initiative)ファイルフォーマットの最新版であるmzIdentML 1.2としてファイル出力する機能をサポートしました。標準的なデータベース検索、Error Tolerant検索、スペクトルライブラリ検索の結果についてmzIdentMLフォーマットで出力する際、 バージョンを 1.1 と 1.2 のどちらにするか選択することができます。
新しいフォーマットでは、特定の使用ケースにおける統制語彙用語(Controlled Vocabulary terms,以降CV用語と表記)の解釈が一部変更されています。XMLの構造は変わらないので、新バージョンは基本的に以前のバージョンとの互換性があり、また同コンセプトは今後も続く予定であるため将来にわたっての互換性もあります。注目すべき変更点は以下の通りです。
クロスリンクペプチド: mzIdentML 1.2 では、クロスリンクペプチドの検索結果をエンコードするための新しい用語と特定の方法が数多く指定されました。インタクトなクロスリンクに関する検索機能はMascotにて実装済です。逆にmzIdentML1.2では現在、モノリンクとループリンクについて完全にサポートできていませんが、将来のバージョン(1.2.1)で対応予定です。
Protein relatoinships:タンパク質と、タンパク質が属するグループとの関係を表す新しい用語がいくつか導入されました。これらの項目に対応するため、Mascot側で、cluster identifier、leading protein、group representative、non-leading proteinの4つの新しい用語について出力項目の微調整を行いました。
Site analysis:mzIdentML 1.2 では、修飾のサイト解析結果および修正局在化スコアをエンコードするための新しい構文が追加されました。しかし残念ながらこの構文は現在のMascotのサイト解析結果を表すには適していないため、MASCOTはmzIdentML1.2の出力項目に対応しきれていません。従ってこれらの情報を利用したファイル出力をしたい場合はmzIdentML 1.1やCSV/XMLフォーマットを選択してください。
Melisa Gualdrón-López, Miriam Díaz-Varela, Gigliola Zanghi, Iris Aparici-Herraiz, Ryan W.J. Steel, Carola Schäfer, Pol Cuscó, Vorada Chuenchob, Niwat Kangwangransan, Zachary P. Billman, Tayla M. Olsen, Juan R. González, Wanlapa Roobsoong, Jetsumon Sattabongkot, Sean C. Murphy, Sebastian A. Mikolajczak, Eva Borràs, Eduard Sabidó, Carmen Fernandez-Becerra, Erika L. Flannery, Stefan H.I. Kappe, Hernando A. del Portillo
Molecular & Cellular Proteomics, August 24, 2022, in press
著者らは、肝臓に潜伏するマラリア原虫が、再活性化しマラリア病の再発を引き起こす事と連動するタンパク質バイオマーカーの候補を探しました。P. vivaxの 生体内感染を引き起こし下血した肝細胞に由来する細胞外小胞(EV)のタンパク質とその含有量を調べるという方法で実施しています。
この研究ではヒト肝細胞を移植した5種類のマウス群を利用しています :1)非感染のControl用のマウス、2)蚊に刺されてP. vivaxに感染したマウス、3)静脈注射で感染したマウス、4) 3に対してさらにMMV048でマラリア原虫の増殖を抑制したマウス、5) 3に対して抗マラリア薬Tafenoquine投与の処置をしたマウス。
血漿由来の細胞外小胞をサイズ排除クロマトグラフィー(SEC,Size Exclulsion Chromatography)で精製し、消化処理後、DDAを用いたLC/MS/MSで解析しました。 データの検索はP. vivaxとSwiss-Protのヒトおよびマウスのデータを統合したカスタマイズデータベースに対して行われました。またタンパク質の相対定量の解析手法としては、タンパク質ごとに最も豊富な上位3つのペプチドの平均面積として計算されるAbundance Estimated per sample (AEpS) を選択しました。
濃縮されたSECの分画には、3つの生物種由来のタンパク質が含まれていましたが、その内訳は、ヒト159、マウス331、P. vivax 66でした。休眠状態のP.vivax特異的なタンパク質のスクリーニングは、異なる実験グループ間のタンパク質変動解析によって行われ、13の潜在的な候補を見出すことができました。
Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。
弊社ではMASCOT Server 2.8.2 パッチをリリースいたしました。新しいUniProt APIの導入に伴い引き起こされていたUniprot proteome データベースのセットアップに関するトラブル(英語版、日本語版)、バージョン2.8.1の仕様変更が原因で発生した3つの問題、Clusterシステムで発生していたError Tolerant検索に関するバグが修正されています。特にDatabase Managerを使用してUniProt proteomesを利用されている場合は、アップデートの適用をお勧めします。Mascotバージョン2.8をお持ちの方は、無料でアップデートをダウンロードできます。
2.8.0から2.8.2へのアップデートを行う場合、2.8.1の内容も自動的に含まれるようになっています。Mascot Server 2.8.1ではファイル出力のオプションとしてmzIdentML 1.2(英語版、日本語版)を追加するとともに、NCBI nr(6億以上のタンパク質アクセッション)など非常に大きなデータベース(英語版、日本語版)の圧縮速度を大幅に向上させて再びMASCOTで利用できるよう改善されています。
Mascot Server 2.7以前のバージョンをお使いの場合、UniProtのダウンロードに関する回避策はこちらのブログ記事(英語版、日本語版)に詳細が記載されています。ご不明な点がございましたら、弊社までお問い合わせください。
マトリックスサイエンス株式会社
〒110-0015
東京都台東区東上野1-6-10 ARTビル1F
電話:03-5807-7895
ファクシミリ:03-5807-7896