Next: 5.2 構成2 Up: 第5章実験結果 Previous: 第5章実験結果

5.1 構成1

構成1のニューラルネットワークを前述のように学習させ、動作させた。ゲームの様子はターゲットが見えている場合と見えていない場合に分けて、図 5.4と図 5.4に示した。両図は1600万回学習させたニューラルネットワークによるものである。ターゲットが見えている時は、入力されている一番近くのターゲットに反応し、そのターゲットの正面を向き前進していることが図 5.4よりわかる。また、ターゲットが見えていない時は、図 5.4より、 [rad]ずつその場で回転してしていることがわかる。このことから、教師信号がうまくニューラルネットワークに学習されたといえる。教師信号には加算やifの構文が含まれていたことから、ニューラルネットワークには加算や簡単な状況判断が出来ることが確認できた。

図 5.4と図 5.4は教師信号とニューラルネットワークの出力との誤差と学習回数の関係を示している。ここでの誤差は教師信号と出力の差の絶対値のことをいう。この2つのグラフからわかるのは、

100万回の時、片方で学習できている項目はもう片方では学習できていない
学習できていなかったものが200万回で急速に誤差を減らしたが、その時最初学習できていた項目の誤差が大きくなった
学習回数を重ねるごとに、誤差の変化がなくなり安定してきたが徐々に誤差が減っているものもあれば、中には少しずつ誤差が大きくなっているものもある

これらのことから、バックプロパゲーションによる学習は、全体を一度に学習させることは難しく、各出力の誤差が大きくなったり小さくなったりしながら、全体としては徐々に教師信号との誤差を小さくしていくと考えられる。バックプロパゲーションはその理論から学習進むと学習毎に誤差が振動することも考えられるが、この場合はまだその傾向は出ていない。

図 5.1: 構成1のゲームの様子(ターゲットが見えている場合)

図 5.2: 構成1のゲームの様子(ターゲットが見えていない場合)

図 5.3: ターゲットが視野内にない場合の誤差の推移(構成1)

図 5.4: ターゲットが視野内にある場合の誤差の平均の推移(構成1)

Deguchi Toshinori
Wed May 15 11:03:10 JST 2002