ニューラルネットワークのバッチ学習、ミニバッチ学習、オンライン学習を解説

2024.4.26

ニューラルネットワーク

ニューラルネットワークの学習
バッチ学習
ミニバッチ学習
オンライン学習

ニューラルネットワークの学習

ニューラルネットワークの学習（パラメータ更新）では、勾配法を用いた以下の作業を繰り返していました。

1 ある地点 $x_0$ における傾きを求める。
2 新たに探索地点 $x_1$ を傾きと学習率 $\eta$ を用いて更新する。
3 傾きが0となる $x$ を見つけるまで1~2の作業を繰り返す。

ニューラルネットワークの学習には、学習用のデータとして訓練データが必要です。

ここからは、訓練データを工夫して用いる学習方法の代表例として、バッチ学習、ミニバッチ学習、オンライン学習を紹介します。

バッチ学習

バッチ学習では、パラメータの更新にすべての訓練データを用いて、以下のようにパラメータ更新を実施します。

1 全ての訓練データを用いて地点 $x_0$ における傾きを求める。
2 新たな探索地点 $x_1$ を傾きと学習率 $\eta$ を用いて更新する。
3 傾きが0となる $x$ が見つかるまで、1-2の更新を繰り返す。

すべてのデータを用いて損失関数の変化を考えるため、学習結果が安定しやすいという特徴があります。

一方で新たな学習データを追加するたびに、全データを用いて再度計算を行わなければならないという欠点があります。

そのため、バッチ学習は全データ数が少ないときに有効な学習手法といえます。

ミニバッチ学習

ミニバッチ学習では、 $N$ 個の訓練データの中から、 $n$ 個を取り出して、パラメータ更新を実施する手法で、ニューラルネットワークでよく用いられます。

取り出した訓練データをミニバッチと呼びます。また取り出すデータ数 $n$ をミニバッチサイズと呼びます。以下のように更新を行います。

1 N個のデータからランダムに $n$ 個を取り出す。
2 $n$ 個のデータを用いて地点 $x_0$ における傾きを求める。
3 新たな探索地点 $x_1$ を傾きと学習率 $\eta$ を用いて求める。
4 新たに $n$ 個のデータを取り出して2-3の更新を行う。
5 1-4の更新を繰り返す。