カイ二乗検定の自由度(分割表の自由度)

[公開日]2017/08/26[更新日]2017/09/18 [カテゴリー]仮説検定 Written by  IMIN

今回はカイ二乗検定などで使われる、分割表の自由度(degree of freedom)について、解説をしていきます。ここで、考える分割表は二次元分割表であり、以下に示すようなものを考えることにします。自由度がわかれば、どの自由度のカイ二乗分布を用いれば良いかの判断が出来ます。

また、カイ二乗分布について詳しくは、カイ二乗分布のわかりやすいまとめにて、まとめました。

まず、自由度の公式はこうです。(縦rマス、横cマスの分割表の場合)

分割表の自由度の公式

$$自由度 = (r-1)(c-1)$$

 
 

二次元分割表の自由度

分割表の自由度は、その分割表を用いて行うカイ二乗検定の、カイ二乗統計量の自由度と一致します。つまり、分割表の自由度を求めることはカイ二乗検定においては必須事項です。

自由度とは、変数のうち独立に選べるものの数を指します。例えば、今回の分割表の場合でいうと、独立に決定するセルの数によって決まるものです。

感覚的に分かる説明

まず直感で考えると、分割表の自由度は、周辺合計が計算されたときに、自由に埋められ得る分割表のセル数と考えられます

よって、周辺合計がわかっているので、縦横とも1行、あるいは1列減らした、r-1行、c-1列が自由に決められるセルの行数、列数になります。よって、自由に決められる、セルの個数はその積で表され、

$$自由度 = (r-1)(c-1)$$

ということです。

数式から自由度を決定する方法

さて、自由度を数式からもとめると、どうなるのでしょうか。

まず、分割表における独立性の検定のための統計量は、

\begin{eqnarray}
\chi^2 = \sum^{r}_{i=1}\sum^{c}_{j=1}\frac{(n_{ij}-E_{ij})^2}{E_{ij}}
\end{eqnarray}

となります。詳しくは⇨独立性のカイ二乗検定 例題を用いてわかりやすく解説

ここで、独立であるという帰無仮説が真である場合について、\(\chi^2\)の分布を近似するカイ二乗分布の自由度を考えることにします。その自由度は、分割表の行と列の周辺合計が固定されているとすれば、単にカイ二乗統計量の式の独立した項の数です。

でも、これらの項のいくつかは、行と列の合計に関する知識によって決められています。

例えば、\(r\)個の行の合計を知ることは、それぞれの行において、1つずつ、すなわち度数\(n_{ij}\)を\(r\)個固定することになりますので、この式において、\(r\)個の項は決定されてしまいます。

したがって、独立した項の数は\((rc-r)\)個に減少します。それぞれの行合計によって固定された度数が、\(c\)個の列合計のうち、最後の列の中にあったとすれば、最初の\((c-1)\)個の列合計が、まだ考慮されずに残っているということです。

この列合計の一つ一つが、分割表の度数を一つずつ固定し、その結果として、独立した項の数を減少させます。よって、独立項としては、\(rc-r-(c-1)\)個が残っていることになります。つまり、自由度\(d.f\)(degree of freedom)は

\begin{eqnarray}
d.f &=& rc - r - (c-1)
&=&(r-1)(c-1)
\end{eqnarray}

となります。

  • スポンサーリンク

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

    CAPTCHA