暇人の研究室

金融工学やR言語・統計学について書いてます。

<

【統計学】P値とは何か?

 

 

 P値はExcelなどで回帰分析を行なった時によく分析結果に出てくるものですが、今回はこの数値が何を意味する説明していきます。

 

 

P値とは?

 

 

まず統計的検定には、誤りを2つの過ちをしてしまう可能性が存在しています。(詳しくは↓参照)

 

www.tkstock.site

 

 

統計的検定での基本的概念は、「帰無仮説が正しいにもかかわらず棄却してしまう誤り」である第1種の過誤が起きてしまう確率を一定に抑え、「帰無仮説が間違っているのも関わらず採用してしまう」第2種の過誤を可能な限り小さくしようとすることにあります。そしてこの第1種の過誤が起こりうる確率を有意水準と言います。

 

 

統計フリーソフトRやExcelなどの分析ツールに備わっている統計的仮説検定では、帰無仮説の採用棄却を行わない代わりに、第1種の過誤が起こりうる確率を算出します。これがP値というやつです。(Rではp-valueと表示されます。)

 

 

なので、実際にツールを使った統計分析では、自分でP値を見て分析結果を採用するか棄却するかの判断しなけれなりません。

 

 

まあ自分で「有意水準Cで仮説検定を行う」として分析結果のP値がそれより上か下かで分析結果が有用かどうか判断するだけです。

 

 

 

P値の意味と性質

 

 

p値の範囲は「0~1」で、その値が小さければ小さいほど、帰無仮説が正しくないと主張するのに強力な根拠となります。

 

 

もしある分析でp値が0.001と算出されたとすると、この意味は「帰無仮説が正しければ、今回起きたような現象は0.1%の確率でしか起きない現象」という意味になります。

 

 

ただ、どれだけp値が小さくても「偶然0.01%の確率を引いたのかも」と言われてしまうと何も主張できなくなってしまいますよね。

 

 

そこで、データを取る前には「p値がこの値より小さければ帰無仮説を棄却(否定)する基準」が設定されます。これが有意水準です。

 

 

一般的に、p値は有意水準αと比較することで、帰無仮説(H0)を棄却するかどうかを判断します。

 

 

もし p値が有意水準 α 以下ならば、帰無仮説(H0) を棄却し、反対に p値が有意水準 α よりも大きいならば、 H0を棄却できないというような判断をします。このαには、0.01(1%)か0.05(5%)の値が使用されることが一般的です。

 

 

 次は簡単な分析で、有意水準とP値についてもう少し見ていきたいと思います。

 

 

ちなみに、統計学についてしっかり勉強するのであれば、↓の本が分かりやすく説明していてオススメです!