プロテインスコアの誤解
Mascotは様々な研究分野のお客様にご利用頂いており、研究論文の中で引用されることも多いのですが、プロテインスコアの解釈や使い方に関して誤解していると思われる記述を時々見かけますので、改めてご説明します。
Mascotは与えられた質量ピークにマッチするタンパク質やペプチドを検索し、そのマッチングの確率をスコアとして表示します。PMF検索では、MSスペクトルを構成するペプチドイオン質量ピークにマッチするタンパク質を検索しますので、プロテインスコアと名付けています。プロテインスコアが高いほどそのタンパク質が実験サンプル中に存在する可能性が高くなります。
一方、MIS検索では、プリカーサイオンとそれに由来するMS/MSスペクトルを構成するプロダクトイオンの質量ピークの両方にマッチするペプチドを検索しますので、イオンスコア(ペプチドスコア)と名付けています。イオンスコアが高いほどそのペプチドが実験サンプル中に存在する可能性が高くなります。なお、マッチしたペプチドが帰属するタンパク質を整理する過程で、タンパク質に帰属するペプチドのイオンスコアを積算してプロテインスコアを計算していますが、PMF検索におけるプロテインスコアのような統計的な意味合いはなく、検索結果ページに表示されるタンパク質は単にイオンスコアの総和としてのプロテインスコアが大きい順に並んでいるに過ぎません。
時々「all proteins identified with a Mascot score higher than 60 were considered reliable」や「peptides and proteins with a Mascot score higher than 35 and 50, respectively, were automatically accepted.」のような記述を見かけますが、プロテインスコアが60のタンパク質に帰属するペプチドは、イオンスコアが60のペプチドが1個だけの場合もありますし、閾値スコアが13でイオンスコアが14のペプチドが47個の場合もあります(注1)ので、偽陽性率(FDR)や「one-hit-wonders(有意なイオンスコアを持つひとつのペプチドを使ってタンパク質を同定するのには無理がある)」を考えると議論の余地が残ります。
たとえば「identified proteins exhibited at least one peptide with an individual Mascot score of p<0.05」 や 「proteins were accepted if they had at least one 'rank 1' peptide with a peptide ions score of more than 50.0.」で表現される方法で偽陽性タンパク質を除外するのは難しいのですが・・・詳しくは ブログ をご覧ください。
|