To view this email as a web page, click here.  日本語のWeb版はここをクリックしてください

newsletter banner

2018年12月号

 「今月のブログ」では、Mascotが定量解析結果をまとめる際に行なっている統計処理についてご説明します。

 「今月の論文」では、Deep proteomics profilingの手法を利用してSAAV(Single Amino Acid Variant:1アミノ酸置換)を同定した研究例をご紹介します。

 「今月の小技」では、多価のプロダクトイオンのm/zを1価のm/z(すなわちMH+)に変換する(de-chargeと呼んでいます)意味合いについてご説明します。

 Mascotニューズレターの バックナンバーはこのページ からご覧いただけます。日本語版は「Japanese」リンクをクリックしてください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

今月のトピックス

今月のブログ:定量データの統計処理
今月の論文:SAAV
今月の小技:De-chargeしてますか?
 

定量データの統計処理:その存在比は信頼できますか?

 Mascot Server単独で、またはMascot ServerとMascot Distillerを組み合わせることで、質量分析計を利用した定量解析プロトコルの全てに対応することができます。Mascot検索でペプチドを同定した後、ペプチドのレベルで収集した定量データを使ってペプチドの存在値を計算し、ペプチドとタンパク質の帰属関係を整理してタンパク質の存在比を求めていますが、次のような定量データの統計処理を通じて存在比の品質をチェックし、信頼できるかどうかを確認できるようにしています。

  • (1) 変動の優位差判定:1標本t検定(one sample Student’s t-test)
     タンパク質の存在比が有意に変動しているかどうかを1標本t検定を使って評価しています。帰無仮説は「母集団の平均値は1(すなわちタンパク質に帰属するペプチドの存在比の平均値は1)」です。

  • (2) ペプチド存在比の標準偏差(standard deviation)
     標準偏差が大きい場合はデータ(ペプチド存在比:fold-change:FC)セットにばらつきがあることを示しています。測定操作に由来する誤差や、ペプチドのタンパク質帰属状況(帰属が間違っている、ひとつのペプチドが複数のタンパク質に由来する)などを確認してください。

  • (3) データの正規分布判定(Shapiro-Wilk W検定)
     t検定はデータが正規分布(またはデータの対数が正規分布する対数正規分布)に従うことを仮定していますので、これを帰無仮説としてW検定を行い、有意差を判定しています。帰無仮説が棄却された場合は、タンパク質の存在比の中身を注意深く検討してください。

  • (4) 外れ値の除去(outlier removal)
     外れ値に相当するデータを除外するアルゴリズム(Dixon法、Grubbs法、Rosner法、自動)を使って合理性のない定量データを除去することができます。外れ値の有無にかかわらず、外れ値除去処理を行なった場合と行わなかった場合とで存在比を比較検討するようにすると良いと思います。

  • (5) 正規化(Normalise)
     存在比に関係するサンプル処理(たとえばサンプル混合比やラベル化などの操作・処理)に由来する誤差を低減させるために、全てのペプチドの存在比の平均値または中間値を1として正規化し、タンパク質の存在比を計算することができます。

 詳しい内容は ブログ にまとめましたのでご覧ください。

distribution of peptide ratios

今月の論文:SAAV

 Deep proteomics profiling(TMTラベル+高性能2D-LC+高性能質量分析計+高度データ解析)の手法を利用して、わずか9個のPanc-1細胞サンプルから、がんに関連するKRASなどを含むタンパク質のSAAV(Single Amino Acid Variant:1アミノ酸置換)を同定した研究例です。同定数の要約は右図(ベン図的イラスト)をご覧ください。ちなみに、細胞9個はどのくらいの重さかというと・・・体重60kgに60兆個の細胞がぎっしり詰まっているとして計算すると 9[個]x60[kg]x1000[g/kg]÷60兆[個]=9x10-9[g]=9[ng] になります。
 Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

Single Amino Acid Variant Discovery in Small Numbers of Cells

Zhijing Tan, Xinpei Yi, Nicholas J. Carruthers, Paul M. Stemmer, and David M. Lubman

J. Proteome Res., Article ASAP, published online November 7, 2018

The authors performed deep proteomic profiling down to the level of nine Panc-1 cells in search of single amino acid variants (SAAV) related to cancer. They used a combination of sample fractionation, tandem mass tag labelling, a carrier/reference proteome, and analysis by LC/MS/MS.

From the 9 cells, they were able to detect 47,414 peptides and 6291 proteins, which is 84% of the number detected from 5000 cells. They attributed this coverage to three factors: use of the carrier/reference to trigger data acquisition for the selected ions, sample fractionation into 9 aliquots, and minimizing sample handling steps to reduce losses.

A critical aspect in determining the SAAVs is filtering out the many false positives. After database searching the data were investigated for variant peptide identifications based on their SAVControl software, which first filters out false peptide identifications using transfer FDR control, and then evaluates the reliability of the SAAV sites by unrestricted mass shift relocation and introduction of alternative interpretations such as modifications.

This approach found a total of 79 SAAVs from the 9-cell Panc-1 sample and 174 SAAVs from the 5000-cell Panc-1 sample. Additionally these included 8 previously reported cancer-related SAAVs derived from 8 proteins.

Thumbnail from featured publication

今月の小技:De-cahrgeしてますか?

 Mascotは、配列DBから検索したプリカーサイオン質量にマッチするペプチドの各々に関して、(この時点でアミノ酸配列はわかりますので)生成され得る「イオンシリーズ / プロダクトイオンm/z表」を作成し、ピークリストのプロダクトイオンm/zとマッチングさせることによりスコアリングし、ペプチドを同定しています。

 ピークリストのプロダクトイオンはm/zと信号強度で構成されていますが、電荷状態の情報はありませんので、Mascotはプロダクトイオンの電荷状態を「1+」または「2+」と仮定して検索しています。プリカーサイオンの電荷状態が「2+」や「3+」であればプロダクトイオンの電荷状態は通常「1+」または「2+」になりますので問題はないのですが、ETDやトップダウン分析では「4+」以上のプリカーサイオンが多発しますので、MS/MSスペクトルには「3+」以上のプロダクトイオンm/zが含まれる可能性が高くなり、「1+」または「2+」のプロダクトイオンを仮定したMascot検索では同定できず、「ペプチド同定取りこぼし問題」が起こります。従いまして、この問題を回避するために生の質量データファイルからピークリストを作成する際に多価のプロダクトイオンを1価(MH+)に変換する「de-charge」の処理が必要になります。

 Mascot Distiller 2.7は、MS/MSスペクトルからモノアイソトピックなプロダクトイオンピークを精度良くかつ高速に抽出するだけでなく、「de-charge」の処理を行ってピークリストを作成しますので、多価プロダクトイオンの存在に由来する「ペプチド同定取りこぼし問題」を回避することができます。また、Mascot Distiller 2.7は、Chimericな複数プリカーサイオン由来のMS/MS混合スペクトルや定量解析データにも対応していますので、最新型の高分解能質量分析計で測定された質量データを余すことなく利用することができ、プロテオミクス解析システムの能力を十二分に発揮させることができます。

 Mascot Distiller 2.7にご興味がありましたら30日間の試用ライセンスでお試しいただけますので、お気軽にお申し付けくださいませ。

Mascot Distiller preferences

お問い合せ

マトリックスサイエンス株式会社

〒110-0015 東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

 

Matrix Science logo

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe