To view this email as a web page, click here.  日本語のWeb版はここをクリックしてください

newsletter banner

弊社がインターネットで公開しているMascot Serverに「SARS-CoV-2」のタンパク質データベースを登録するとともに、利用条件を緩和しました。詳しくは [News]ページ をご覧いただきまして、リモート研究ワーク等にお役立ていただければ幸いです。

「今月のブログ」では、タンパク質のFDRをペプチドのFDRとタンパク質に帰属するペプチド数でコントロールする際の挙動についてご説明いたします。

「今月の論文」では、KおよびRのN末端側切断酵素である「Tryp-N」の開発ストーリーとも言うべき研究論文を取り上げました。

「今月の小技」では、弊社がインターネットで公開しているMascot Serverのデータベース登録変更についてご説明いたします。

Mascotニューズレターの バックナンバーはこのページ からご覧いただけます。日本語版は「Japanese」リンクをクリックしてください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

今月のトピックス

タンパク質のFDR
Tryp-Nの開発ストーリー
公開Mascotの登録DB変更
 

タンパク質のFDR

Mascot Server 2.7で実装したタンパク質のFDR計算では、Target DB(実在するタンパク質で構成)とDecoy DB(実在しないアミノ酸配列を持つタンパク質で構成)に対して独立に検索を実行し、それぞれに存在するタンパク質の数を比較しています。これはペプチドのFDR計算と似ていますが、タンパク質のFDRでは次のような条件を満たすタンパク質を計算対象としています。

  • 有意なPSM(Peptide Sequence Match)を持つタンパク質を対象とし、そのPSMを持つ複数のタンパク質が存在する場合はそれらをメンバーとする「Protein family」としてグルーピングする。
     
  • PSMの帰属状況がまったく同じ「same-set」なタンパク質郡についてはその中からひとつの代表タンパク質を決めてProtein familyのメンバーとする。
     
  • Protein familyのメンバーの数をタンパク質のFDR計算に使用する。たとえば、Protein familyが2つあり、それぞれ4個のメンバーと1個のメンバーで構成されている場合、計算で使用するメンバー数は5となる。
     
  • Target DB上で有意なPSMを少なくとも1個含むタンパク質を「True positive」、Decoy DB上で有意なPSMだけを含むタンパク質を「False positive」とする。
     

タンパク質のFDRをコントロールするには次の2つの方法があります。

  • (1) ペプチドのFDRを調整する
     
  • (2) タンパク質に帰属する有意なPSMの数を変更する
     

(2)のデフォルト値は1ですが、これは「one-hit wonders」なタンパク質が含まれる可能性がありますので、以前 ブログ でご紹介したように、この値を2以上に設定すると確実に同定されたタンパク質を抽出することができます。ところが右図のように、PSMの数(Min. sig. seq. =1と2)に対してタンパク質のFDRを1%にコントロールした状況を比較すると中身がだいぶ違ってきます。

詳しい考察を ブログ にまとめましたのでご覧ください。

Movie theatre

Tryp-Nの開発ストーリー

Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

Tryp-N: A Thermostable Protease for the Production of N-terminal Argininyl and Lysinyl Peptides

John P. Wilson, Jonathan J. Ipsaro, Samantha N. Del Giudice, Nikita Saha Turna, Carla M. Gauss, Katharine H. Dusenbury, Krisann Marquart, Keith D. Rivera, and Darryl J. Pappin

J. Proteome Res. Publication Date: March 6, 2020

「Tryp-N」は、KとRのN末端側を切断する新規の酵素として 2014年のASMS(WP 170) 2015年のUS HUPO(lightning talk)で発表されており、また、この研究論文の著者が設立した ProtiFi社 が製品販売していますので、すでにご贔屓にされているお客様もいらっしゃるかもしれません。

今回の研究論文では、Tryp-Nの特性・性能に関する報告に加えて、Tryp-Nのアミノ酸配列とそこに行き着くまでの分子設計プロセスも公開してます。Lys-Nとulilysinの構造解析を通じて「無駄な構造部分」を推定し、類似タンパク質に対してバイオインフォマティックス解析手法を適用して機能モチーフを特定し、環境メタゲノムを含む利用可能なデータベースに対してインシリコスクリーニングを行なって候補配列を探索しています。

ちなみに、公開されたTryp-Nのアミノ酸配列を SWISS-MODELで処理すると、Tryp-Nの立体構造や計算に使われたテンプレート情報などを確認することができます。ご興味がありましたら2週間閲覧可能な 解析例 をご覧ください。

なお、ラストオーサーのD. J. PappinはMascotの前身である MOWSE の開発者のひとりです。

Thumbnail from featured publication

公開Mascotの登録DB変更

[News] ページ でお知らせしたように、弊社がインターネット上で公開しているMascot Serverの利用条件を緩和し、それに伴う検索リソース増加分を確保する等の理由によりNCBIprotの利用を制限することにしましたので、検索条件設定ページの[Database(s)]項には「NCBIprot」の登録はありません。ただし、NCBIprotに対する検索を希望するお客様には個別に対応いたしますので、検索対象としたい生物種などの検索条件をご連絡ください。

なお、プロテオーム情報が充実した生物種をUniprot Proteomeから選出して 新たに登録 しました。 Uniprot Proteomeにはバリアントも含まれていますので、Error tolerant検索を併用することで有用な結果が得られる可能性があります。もし希望する生物種の登録が見当たらない場合はご連絡ください。75%以上のBUSCOスコアを持つ生物種であれば登録するようにいたします。

Mascot tip

お問い合せ

マトリックスサイエンス株式会社

〒110-0015 東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

Matrix Science logo

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe