Next: 4.2 バックプロパゲーション Up: 第4章学習法 Previous: 第4章学習法

4.1 一般化デルタルール

この章ではニューラルネットワークに学習をさせるための学習則の説明をする。[5] 本研究での学習には、バックプロパゲーション法（back-propagation, 誤差逆伝搬法）という学習則を用いるが、この節ではまず、第二章で説明したニューロンの特性を一般化する。ある素子 j は、他の素子 i の出力を入力として受け、重みをかけて加えたものを入力の総和とする。

そして、出力は入力の総和に単調増加関数 f を施したもので表されることにする。

ただし、しきい値は重みの一つとして含まれていると考える。ここで、出力関数 f が階段関数であれば、素子は第2章で説明したものと同じになる。ここでは、出力関数 f としてシグモイド関数を用いることにする。シグモイド関数は、０から１までの連続した値をとる関数なので微分可能であり、後に解析的に問題を解くことが可能になる。

次に、神経回路における学習を一般化して考える。をある入力ベクトル c に対して出力素子 j が出すべき望ましい出力、をその時の出力素子 j の実際の出力とした時、学習の評価として、次のような``誤差関数 E '' を考える。

このような形の誤差関数を最小にする手続きを一般に``最小2乗誤差``(least mean square,LMS)法という。はその時の素子間の結合の強さ、すなわち重みで決まるため、誤差関数も重みに関して陰に定義された関数となる。したがって、各重みの値を軸としてできる空間を考え、さらにこの誤差関数 E によって定義される値を高さと考えれば、 E は重み空間上の超曲面として``誤差曲面''を与えることになる。任意の重み状態から、この誤差曲面の極小値に達するには、例えば各重みを、に比例した量