タンパク質定量比に対するp値の計算方法
タンパク質の定量比は、Mascot検索でマッチした(そのタンパク質に帰属する)ペプチドの定量比を平均して求めますが、ペプチドの定量比は正規分布に従わないため、それらを対数変換して(対数空間上で正規分布に従うと仮定して)統計処理しています。
タンパク質の定量比が有意に変動しているかどうかはt検定を使って判定しています。帰無仮説は「母集団の平均値は1(そのタンパク質に帰属するペプチドの定量比の平均値は1)」としていますので、信頼係数95%で求めた信頼区間が1から外れる場合はタンパク質の定量比の値などを太文字で強調表示するようにしています。たとえば、ペプチド定量比の数がn=25、これらの幾何平均がm=0.896、同様に幾何標準偏差がs=1.15、自由度n-1に対するt分布の95%に対応する信頼係数をt分布表で調べるとc=2.064ですので、この場合の信頼区間は「 0.896/1.15^(2.064/√25)=0.846 から 0.896*1.15^(2.064/√25)=0.949 まで」となり、1から外れていますので太文字で表示しています。
タンパク質定量比の期待値pはタンパク質定量比のt値から計算することができます(t検定の式に対数をとって変形すると t=log(m)/(log(s)/√n) になります)。上の例を適用するとt=-3.929になりますので、アナログ的な操作では、t分布表で自由度n-1=24の行を見て、tの絶対値3.929に近い有意確率(危険率α)を探します。厳密に計算したい場合は・・・手計算はとても面倒くさいのでExcelなどの表計算アプリを使用すると、セルに「T.DIST.2T(3.929,24)」と入力してリターンするとp=0.000631と表示され、0.05よりも小さな値になりますので、統計的に有意であることがわかります。ちなみにn=5の場合はp=0.154となり、統計的に疑わしくなります。
Mascot Distillerで定量計算を実行した場合は、[メニューバー]→[Analysis]→[Quantitation Reports] に表形式の定量計算結果がリスト表示されます。たとえば [table_proteins] を選択すると別ウインドウに表形式の定量計算結果が表示されますので、そのウインドウをアクティブにした状態で「CTRL+A、CTRL+C、CTRL+V」の順にキー操作を行って表計算アプリに貼り付ければ、上記の要領でタンパク質定量比の期待値pを簡単に一括計算することができます。
Mascot Distillerではペプチド定量比の数nは異なるペプチドの数を使っています。すなわち、異なる電荷状態のペプチドが複数存在する場合でもひとつのペプチドとしてカウントしていますので、マッチしたペプチドの数をnにすればp値を改善するのに役立つかもしれません。上記の定量計算結果リストから [table_peptides] を選択すると楽に処理することができます。
Mascotの定量計算に関する統計処理の詳細に関しては ヘルプページ をご覧ください。
|