2016/08/23

2020/04/14

仮説検定とは?初心者にもわかりやすく解説!

仮説検定

ライター:

仮説検定(hypothesis testing)とは、「とある仮説に対して、それが正しいのか否かを統計学的に検証する」という推計統計学の手法の一つです。また、統計的仮説検定、もしくは省略して単に検定と呼ぶこともあります。

今回はわかりやすい例を交えつつ、解説していきます。このページは初心者でもわかるよう作りましたので、初めての方も安心してお読みください!

どのような場面で使うのか?

まずは仮説検定がどのような場面で使えるのか、その具体例を見ていきましょう。

ここに、”自称”予知能力のある占い師がいた。その能力が本物かを検証すべく、野球の試合の勝ち負け予想をさせたところ、5試合連続で予想を的中させた。さて、ここで占い師の予知能力は本物であると言えるのか?(※なお試合の勝率は常に\(\frac{1}{2}\)とする)

名称未設定-2

この問に対して、「5試合も連続で当てたのだから本物だろ」って答える人もいれば、「いやいや、たかだが5試合じゃ分からない。6試合目で間違うかも知れないぞ」と言う人もいることでしょう。意見が割れそうなところですよね。

これを統計学を用いて客観的に判断するのが、仮説検定と呼ばれる手法です。まず、仮説(\(H_0\)と名付ける)として

\(H_0\):この占い師には予知能力などない。

というのを立てます。この仮説が間違っていると説明できれば、

\(H_1\):この占い師には予知能力がある。

ということになります。(このときの状態は\(H_1\)と名付ける)

では、いよいよ仮説検定という手法を使ってこの\(H_0\)が正しいかについての検証をしていきます。さて、そもそも、予知能力なしで5連続で勝つチームを当てる確率は、

$$(\frac{1}{2})^5 = \frac{1}{32} = 0.03125$$

により、3.125%となります。もし、占い師に予知能力がなかったらこの約3%の確率の「当てずっぽう」に成功したと言えます。有り得ないというほどではありませんが、非常に低い確率ですよね。

私が「それは、とても低い確率だから仮説\(H_0\)は間違ってるだろう」考えることで、仮説\(H_1\)が正しいことになり、占い師の予知能力が認められます。

しかし、ここで問題が発生します。私は、仮説\(H_0\)が間違っていると勝手に判断しましたが、それが正しい確率だって3.125%あるわけです。

果たして私の主観で、「正しい確率がたった3%だから間違ってる!」と勝手に決めてしまってもいいのでしょうか。

もちろんダメです。統計的仮説検定では、この判断基準を有意水準\(α\)と名付け、計算をする前に決めておきます。通常、5%や1%(\(α=0.05\)や\(a=0.01\))を使います。今回の場合、有意水準が5%であれば、\(H_0\)は間違っていると判断できます。しかし有意水準が1%であったら、\(H_0\)は間違っているとは言えません。

ここで用語について説明を加えさせていただきます。

まず、二つの仮説、\(H_0\)、\(H_1\)をそれぞれ帰無仮説(きむかせつ)、対立仮説というような呼び方をします。

また、\(H_0\)は間違っていると判断することを、\(H_0\)を棄却(ききゃく)すると言います。さらに\(H_0\)を棄却したにも関わらず、\(H_0\)が実は正しかった場合を「第一種の過誤」と呼びます。そして、仮説検定における第一種の過誤の確率は有意水準\(α\)の値に一致します。

さて、「第一種の過誤」があるのならば、「第二種の過誤」もまたあります。それは\(H_1\)が実は正しかったのにも関わらず、\(H_0\)を棄却しないことを指します。

また、今回の場合の帰無仮説が正しいとしたときに、今回の占いの結果が得られる確率0.03125をp値(p value)という呼びます。p値とは、「帰無仮説が正しいとしたときに、観測データの実現値が得られる確率、またはそれ以上に極端なデータが得られる確率」と定義されます。帰無仮説を棄却する条件は、p値が有意水準より小さいことです。

耳なれない言葉がたくさん登場して混乱するところかと思いますが、非常に大切な言葉達なので、是非覚えておいてください。表にまとめておきます。

誤りの関係性

用語意味
帰無仮説仮説検定で検証したい仮説。通常\(H_0\)と表す。
対立仮説帰無仮説が成り立たない状態を記述。帰無仮説が間違っていると判断した場合この対立仮説を採択することになる。通常\(H_1\)と表す。
棄却仮説を間違っていると判断すること。
第一種の過誤帰無仮説が正しいのにも関わらず、帰無仮説を棄却してしまうこと。
第二種の過誤対立仮説が正しいのにも関わらず、帰無仮説を棄却しないこと。
有意水準帰無仮説を棄却するときの判断基準。第一種の誤り確率がこの有意水準の値よりも小さいとき帰無仮説を棄却する。文字ではα(アルファ)で表し、5%や1%を取ることが多い。
p値帰無仮説が正しいとしたときに、観測データの実現値、もしくは更に極端な観測データが得られる確率。これが有意水準以下のとき帰無仮説を棄却する。

帰無仮説の決め方~どちらを帰無仮説にしても良いのか~

ところで、先ほどの例では帰無仮説を「この占い師には予知能力などない。」と設定しましたが、反対に「予知能力がある」の方を帰無仮説に設定してもいいのでしょうか?

答えは、ダメです。「予知能力がない」方を帰無仮説にしたのには理由があります。

仮説検定では、主張したい仮説ではない方の仮説を帰無仮説とします。この場合、予知能力の存在について主張したいので、予知能力がないことを帰無仮説に置かなくてはいけないのです。文字通り、帰無仮説とは無に帰する仮説になります。

仮説検定では、この帰無仮説の棄却をし、主張したいことの正しさの証明を目指します。ですので、主張したいことは、対立仮説においておきましょう!

有意水準が5%や1%を用いる理由

有意水準は通常5%や1%を用いると前述しましたが、なぜこのような値を使うのでしょうか。その答えは、5%や1%で起きる事は滅多に起きない、非常に珍しい事と言えるからです。

そもそも、帰無仮説を棄却することと、棄却しないことの重みは違います。

”帰無仮説を棄却しない=帰無仮説を受容する” ではない!

帰無仮説を棄却 ⇒ 帰無仮説は違う。対立仮説を採用、となります。

棄却する場合

帰無仮説を棄却しない ⇒ 帰無仮説が正しい、とはならない!

棄却しない場合

この場合は、あくまでも証拠不十分により棄却できなかったに過ぎません。また、新たな根拠を探して、帰無仮説の棄却を目指すことだって出来ます。

つまり、棄却というのは、簡単にするべきではないのです。一度棄却してしまったら、その仮説を再び考えることはしません。だから慎重に棄却します。そのため、有意水準は5%や1%と低くなくてはならないということです。

また、1%で行った仮説検定のほうが、5%で行った仮説検定よりも正確率の高いものになります。

 

ところでこの仮説検定、私たちの生活ではどのように役立っているのでしょうか。

仮説検定は新薬開発の現場で使われている

rikejo

仮説検定が実務で使われている場面として、新薬の開発が挙げられます。例えば、新しいかぜ薬が開発段階にあったとします。その効き目について検証したい場合、

帰無仮説:新しい風邪薬には効き目がない
対立仮説:新しい風邪薬には効き目がある

というようにして、仮説検定を行います。この検定で、一定の有意水準を満たした薬のみが、新薬として世に出回ります。また、新薬に限らず、既存の薬を改良する場合でも

帰無仮説:改良後の薬の効き目と従来の薬の効き目に差は見られない
対立仮説:改良後の薬の方が従来の薬より効き目が良い

として、仮説検定によって薬の効き目を確かめます。

私たちが飲む薬の効き目が、ある程度保証されているのも、実は仮説検定による基準が設けられているからなのです。製薬会社には、統計解析職というものが存在するのもこのためです。

仮説検定のおおまかな手順

最後に、仮説検定の手順についてもう一度おさらいしておきます。

手順①:検証したいことについて2つの仮説、帰無仮説と対立仮説を立てます。このとき、主張したい説の方を対立仮説とします。

手順②:帰無仮説が正しいとしたときに、その観測データの実現値が得られる、もしくはそれよりもさらに極端なデータが得られる確率(p値)を求めます。

手順③:手順②で計算したp値が有意水準以下の場合、帰無仮説を棄却し、対立仮説を採択します。そうでない場合、帰無仮説は棄却出来ず、検定は失敗に終わります。

まとめ

仮説検定について、いかがでしたでしょうか。耳慣れない言葉が数多く登場したかと思いますが、どれもよく使うものなので覚えておきましょう。

また、仮説検定自体も考え方がややこしいという人が多くいます。もし、学習していく上で頭がこんがらがってきたら、もう一度今回の記事を読み返していただければと思います。最初の概念の理解が非常に大切です。もし、理解できない部分があったら、繰り返しお読み頂ければ幸いです。また、コメントでの質問も随時受け付けております。

仮説検定に関する他記事

・仮説検定を行う際に登場する棄却域について解説を加えています。
仮説検定における棄却域とは?求め方も解説

・仮説検定には片側検定、両側検定とがありますが、どちらをどのようなシチュエーションで用いるのか、例題を用いて詳しくまとめました。
片側検定と両側検定の違いをわかりやすく解説

・おそらく最も使われているであろう、仮説検定手法である、t検定についてまとめました。
t検定とは?種類と手順を解説!

・母分散は通常、既知(分かっているもの)ではありませんが、もし分かっていたとするとz検定というのができます。
正規分布の母平均の検定手順(母分散既知,Z検定)

・二つの変数が独立であるか否かを検定するために使われるのが独立性のカイ二乗検定です。
⇨ 独立性のカイ二乗検定 例題を用いてわかりやすく解説

・観測データの当てはまりの良さを検定するための、適合度のカイ二乗検定はこちら。
適合度検定をカイ二乗検定で行う例題と手順

 

(totalcount 435,354 回, dailycount 710回 , overallcount 16,392,752 回)

ライター:

仮説検定

single-banner

COMMENT

コメントを残す

メールアドレスが公開されることはありません。
*は必須項目です。




CAPTCHA