2017/10/10

2020/04/14

ベイズ統計の仮説検定〜頻度論との違い〜【第1回】

ベイズ統計

ライター:

ベイズ統計にも、頻度論と同じように仮説検定が存在します。頻度論における仮説検定は、ネイマン-ピアソンの基本定理に基づいて行われますが、ベイズ統計では、それとは違った考え方やアプローチで仮説検定を行います。それらのことを詳しく解説していきます。

ベイズ統計の仮説検定は全6回にわたって説明しています。他のページもぜひご覧ください。

ベイズ統計の仮説検定

頻度論における仮説検定の考え方

まず最初に、頻度論における仮説検定を説明します。

(仮説検定の基本的な解説はこちら→『仮説検定とは?初心者にもわかりやすく解説!』)

頻度論の最も基本的な前提条件は、
・母集団の未知パラメータを定数
・データを変数
として扱います。

例えば、日本人男性の平均身長について、

$$H_0:\mu=172$$

という仮説検定を考えます。この場合、パラメータ\(\mu\)は定数ですから、\(\mu=172\)を満たす確率を出すことはできません。なぜなら、確率は確率変数にのみ与えられるからです。

そこで、パラメータを固定した上で、データが得られる確率を考えようとしたのが頻度論における仮説検定です。上の例で言えば、平均身長は\(\mu=172\)であるかどうかわからないけど、とりあえず\(\mu=172\)と決めつけた上でデータを得た、と考えるのです。そしてこの前提のもとで、得られたデータの平均身長が190cmだったら、「平均身長を\(\mu=172\)と決めつけたのは間違いだったのではないか」と吟味するのが頻度論における仮説検定になります。

(もっと詳しく→『仮説検定とは?初心者にもわかりやすく解説!』)

以上のことを条件付き確率で表すと、

$$P(X|H_0)$$

と書くことができます。これは帰無仮説を満たしている条件のもとで、データが得られる確率であると言えます

ベイズ統計における仮説検定の考え方

頻度論の考え方に対し、ベイズ統計には、母集団の未知パラメータを確率変数とみなし、データを定数として扱う考え方があります。

(参考:頻度論との考え方の違い→『ベイズ統計学の考え方~ベイズ論と頻度論の違い~』)

日本人男性の平均身長について、

$$H_0:\mu\leq 172$$

という仮説検定を考えます(先ほどと違い不等式にしたのは、等式の考え方は難しいからです。等式における説明は【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜 で扱います)。この場合、パラメータ\(\mu\)は確率変数ですから、平均身長が\(\mu\leq 172\)である確率を出すことができます。

\(\mu\)は分布を持つので、\(\mu\)の密度関数を\(\pi(\mu)\)とすると、\(\mu\)が172以下である確率\(P(\mu\leq 172)\)は以下のようになることがわかります。

このように、ベイズ統計における仮説検定では、仮説を満たす確率そのものを導くことができます。さらに、これがデータが得られた上での分布(事後分布)であるならば、その確率は、条件付き確率を用いて、

$$P(H_0|X)$$

と書くことができます。これはデータが得られたもとで、帰無仮説を満たす確率になります。

まとめ〜頻度論の検定とベイズ統計の検定の違い〜

いかがでしたでしょうか。上記のことから、これら二つの違いをまとめると、

・頻度論における仮説検定

帰無仮説を満たしている条件のもとで、データが得られる確率\(P(X|H_0)\)が得られる

・ベイズ統計における仮説検定

データが得られたもとで、帰無仮説を満たす確率\(P(H_0|X)\)が得られる

ということになります。

つまり、求めている確率そのものが違います。よってベイズ統計における仮説検定は、従来の仮説検定とは全く違った考え方やアプローチで行う必要があるのです。

 

次の回では、例題を用いて実際に検定を行っていきます。

ベイズ統計の仮説検定
(totalcount 19,412 回, dailycount 50回 , overallcount 16,393,105 回)

ライター:

ベイズ統計

single-banner

COMMENT

コメントを残す

メールアドレスが公開されることはありません。
*は必須項目です。




CAPTCHA


  • 賀蕊ぜい 2017.12.11 1:49 PM

    とてもいいサイトです。

  • 賀蕊ぜい 2017.12.11 1:49 PM

    とてもいいサイトです。