ベイズ統計の仮説検定〜問題点とまとめ〜【第6回】

[公開日]2017/10/10[更新日]2017/10/11 [カテゴリー]ベイズ統計 Written by  masa

ベイズ統計の仮説検定は全6回にわたって説明しています。他のページもぜひご覧ください。

ベイズ統計の仮説検定

【第1回】ベイズ統計の仮説検定〜頻度論との違い〜
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜 
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜   ←イマココ!

 
 

ベイズ流仮説検定の問題点〜非正則事前分布は使えない!〜

ベイズ統計には、事前分布の一つとして非正則事前分布というものがあります。この分布は、完全な無情報分布であり、最も客観的な分布として知られています。しかし、ベイズ流仮説検定では非正則事前分布を使うことはできません。このことについて、説明していきます。

非正則事前分布の密度関数は以下のように与えられます。

\(\pi(\theta)=C\ \ \ \ \ (-\infty<\theta<\infty)\)

これは以下のようなグラフになります。

もし【第4章】までの幅のある仮説を立てるならば、事前確率を設定することはできません。なぜなら、割り当てられる確率が無限大になってしまうからです。

また、【第5章】で扱った点帰無仮説の場合においては、\(\pi_0\)を割り当てることはできますが、ベイズファクターに正当な解釈を与えません。以下それを証明していきます。

証明

\(\Theta_i\)のもとでの\(\theta\)の密度関数を\(g_i(\theta)\)とし、

\(g_i(\theta)=c_i\)

と設定すると、ベイズファクターは

\(BF_{01}=\frac{\int_{\Theta_0}f(x|\theta_0)c_0d\theta}{\int_{\Theta_1}f(x|\theta_1)c_1d\theta}=\frac{c_0\int_{\Theta_0}f(x|\theta_0)d\theta}{c_1\int_{\Theta_1}f(x|\theta_1)d\theta}\)

となります。これは\(c_i\)に依存しているので、ベイズファクターから正当な解釈は得られません。Q.E.D

ベイズ統計における仮説検定は従来の検定より厳しい!?

第3回】以降の「やむを得ない理由がない限り、帰無仮説を棄却すべきではない」という従来の考え方に基づいたベイズ流の仮説検定は、頻度論の仮説検定に比べ、帰無仮説が棄却されにくいという特徴があります。もちろん事前に設定する分布や確率によって変化はあるものの、最も客観的な分布である無情報分布や、事前確率を\(\pi_0=\frac{1}{2}\)とした場合においては、帰無仮説が棄却されにくい傾向があります。

帰無仮説を棄却するためにはサンプル数を大きくするなどする必要があります。

ベイズ統計における仮説検定の総まとめ

全6回にわたる検定の説明をまとめました。

【第1回】ベイズ統計の仮説検定〜頻度論との違い〜
頻度論における仮説検定は\(P(X|H_i)\)を導出していたのに対し、ベイズ統計における仮説検定は\(P(H_i|X)\)を導出します。よって、従来の仮説検定とは違ったアプローチで検定を行う必要があります。

【第2回】ベイズ統計の仮説検定〜基本的な検定〜
\(P(H_i|X)\)はデータが与えられた上での仮説を満たす確率です。つまり、ベイズ統計の仮説検定では仮説が成り立つ確率を直接計算できます。そこで、帰無仮説が成り立つ確率と、対立仮説が成り立つ確率を算出し、大きい確率である方の仮説を受容する、という検定問題を考えました

【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜
しかし、従来の仮説検定の考え方では、帰無仮説は安易に棄却してはいけないという考え方があります。そこで、その考え方を取り入れたベイズ流仮説検定を考えます。従来の仮説検定の「第1種の誤り確率を一定以下に抑える」という考え方に基づいて、事後オッズ比を一定以下に抑える検定問題を考えました

【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
事前確率を含めた事前分布は、自分で設定する必要があります。その設定の仕方によって、仮説の棄却されやすさに差が生じてしまいます。そこで、ベイズファクターという指標を導入し、検定結果だけでなく、その検定の証拠の強さも評価することを考えました

【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
帰無仮説が点帰無仮説の場合、事前確率が0になってしまいます。そこで、事前確率を自分で割り当てた上で検定を行いました

【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜
事前分布には非正則分布を使うことはできません。幅のある仮説を立てると、割り当てられる確率が無限になり、ベイズファクターに正当な解釈を与えないからです。また、頻度論の検定に比べると、ベイズ流仮説検定は帰無仮説が棄却されにくい傾向にあります

 

いかがでしたでしょうか。最後に、ベイズ統計における仮説検定の長所、短所をまとめます。

・長所
仮説が成り立つ確率を直接計算できる。この確率は、分析者が真に知りたい確率である。

・短所
事前分布の設定や事前確率の割り当てなど、自分で決定することが多いので、客観性に欠ける。

 

ベイズ流仮説検定の説明は以上です。ぜひベイズ統計における仮説検定を試してみてください。

ベイズ統計の仮説検定

【第1回】ベイズ統計の仮説検定〜頻度論との違い〜
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜 
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜   ←イマココ!

 

  • スポンサーリンク

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

    CAPTCHA