2017/10/10
2020/04/14
ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜【第3回】
ベイズ統計の仮説検定は全6回にわたって説明しています。他のページもぜひご覧ください。
【第1回】ベイズ統計の仮説検定〜頻度論との違い〜
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜 ←イマココ!
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜
頻度論に考え方に基づくベイズ流仮説検定
前回の前説でもお話しした通り、「やむを得ない理由がない限り、帰無仮説を棄却すべきではない」という従来の考え方に基づいたベイズ流の仮説検定の説明を行っていきます。
前回の【第2回】ベイズ統計の仮説検定〜基本的な検定〜に引き続き、このグラフを例に説明していきます。
従来の仮説検定の考え方は、ネイマン-ピアソン流の考え方で、
①第1種の誤り確率を一定以下(主に5%など)に抑えながら
②第2種の誤り確率を小さくする
というものです。第1種の誤り確率は、「帰無仮説が正しいのにも関わらず、帰無仮説を棄却してしまう確率」であり、①を満たすことが従来の仮説検定の前提条件になります。この前提条件から、「あまりにもおかしなデータが得られない限り、帰無仮説を棄却するのは避けよう」という考えが見えてきます。これが初めに書いた「やむを得ない理由がない限り、帰無仮説を棄却すべきではない」という考え方につながっています。(参照→仮説検定とは?初心者にもわかりやすく解説!)
しかし、上記のグラフで行われたベイズ流の仮説検定では、この前提条件に従っていません。第1種の誤り確率ではありませんが、「帰無仮説を満たす確率」が40%もあるのです。これは「やむを得ない理由がない限り、帰無仮説を棄却すべきではない」という考え方に反しています。
そこで、「帰無仮説を満たす確率」を一定以下に抑えることを考えます。これが、頻度論の考え方に基づくベイズ流仮説検定になります。
・ネイマン-ピアソン流仮説検定
第1種の誤り確率である「帰無仮説が正しいのにも関わらず、帰無仮説を棄却してしまう確率」を一定以下に抑える
・頻度論の考え方に基づくベイズ流仮説検定
「帰無仮説を満たす確率」を一定以下に抑える
事後オッズ比を用いて検定する
従来の仮説検定では有意水準を5%とし検定を行うのがメジャーであるので、今回のベイズ流仮説検定でも、「帰無仮説を満たす確率」を5%以下に抑えることを考えていきます。
ここで、事後オッズ比という概念を導入します。
事後オッズ比は、事後分布において、「対立仮説を満たす確率よりも、帰無仮説を満たす確率がどのくらい大きいか」つまり、
$$\frac{P(H_0|X)}{P(H_1|X)}$$
で表される
つまり先の例でいうと、事後オッズ比は
\(\frac{P(H_0|X)}{P(H_1|X)}=\frac{40\%}{60\%}=\frac{0.4}{0.6}=\frac{2}{3}\)
と計算できます。
この事後オッズ比が、\(\frac{1}{19}\)以下の場合帰無仮説を棄却し、\(\frac{1}{19}\)より上の場合帰無仮説を受容します。
なぜ\(\frac{1}{19}\)が基準なのでしょうか。それはグラフを描いてみればすぐわかります。
これが\(\frac{1}{19}\)の様子です。\(100\%×\frac{1}{1+19}=5\%\)で、赤い部分の確率が5%になっているとわかります。
つまり、事後オッズ比が\(\frac{1}{19}\)以下なら、帰無仮説を満たす確率が5%以下であると言えるのです。
実際に例題を用いて検定する〜頻度論に考え方に基づくベイズ流仮説検定〜
では、実際に例題を用いて計算して見ましょう。
成人男性の平均身長が170cmより大きいかどうかを調べたい。いま、成人男性の身長は\(N(\mu,10^2)\)に従っているとする。ひとりのデータ取ってきたところ、177cmであった。成人男性の平均身長が170cm以下であると言えるか。ただし、\(\mu\)は事前に\(N(172,20^2)\)に従っているとし、しきい値を\(\frac{1}{19}\)とする。
仮説は次のようになります。
\(H_0:\mu\leq 170\)
\(H_1:\mu> 170\)
さて、まずは事後分布を計算しましょう。事後分布の平均、分散は以下のinfoから次のように計算できます。
母平均\(\mu\)、母分散\(\sigma^2\)に従う正規母集団から大きさ\(n\)の標本を抽出し、標本平均\(\overline{x}\)を得たとする。母平均\(\mu\)の事前分布として平均\(\eta\)、分散\(\tau^2\)の正規分布をとるとき、\(\mu\)の事後分布は
$$平均:\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}=\frac{\frac{n}{\sigma^2}\overline{x}+\frac{1}{\tau^2}\eta}{\frac{n}{\sigma^2}+\frac{1}{\tau^2}}$$
$$分散:\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}=\frac{\frac{\sigma^2\tau^2}{n}}{\frac{\sigma^2}{n}+\tau^2}$$
の正規分布に従う
さらに詳しく→正規分布の事後分布の平均と分散【ベイズ】
$$事後分布の平均:176$$
$$事後分布の分散:80$$
ここで、標準化することにより、
\(P(\mu\leq 170|X=177)=\Phi(\frac{170-176}{\sqrt{80}})=\Phi(-0.671)=0.251\)
\(P(\mu> 170|X=177)=1-0.251=0.749\)
が得られます。よって、事後オッズ比は
\(\frac{P(H_0|X)}{P(H_1|X)}=\frac{0.251}{0.749}=0.335\)
となります。0.335は\(\frac{1}{19}\)よりも大きいので、帰無仮説を受容し、成人男性の平均身長は170cmより大きいとは言えない、と判断します。
まとめ
いかがでしたでしょうか。このように、頻度論に考え方に基づくベイズ流仮説検定では、事後オッズ比を求めて検定していきます。
次回は、検定の証拠の強さを表すベイズファクターについて説明していきます。
【第1回】ベイズ統計の仮説検定〜頻度論との違い〜
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜 ←イマココ!
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜
Recommended