next up previous contents
Next: 5.2 構成2 Up: 第5章 実験結果 Previous: 第5章 実験結果

5.1 構成1

構成1のニューラルネットワークを前述のように学習させ、動作させた。 ゲームの様子はターゲットが見えている場合と 見えていない場合に分けて、 図 5.4と 図 5.4に示した。 両図は1600万回学習させたニューラルネットワークによるものである。 ターゲットが見えている時は、入力されている一番近くのターゲットに反応し、 そのターゲットの正面を向き前進していることが 図 5.4よりわかる。 また、ターゲットが見えていない時は、 図 5.4より、 tex2html_wrap1250 [rad]ずつその場で回転してしていることがわかる。 このことから、教師信号がうまく ニューラルネットワークに学習されたといえる。 教師信号には加算やifの構文が含まれていたことから、 ニューラルネットワークには加算や簡単な状況判断が出来ることが確認できた。

図 5.4と図 5.4は 教師信号とニューラルネットワークの 出力との誤差と学習回数の関係を示している。 ここでの誤差は教師信号と出力の差の絶対値のことをいう。 この2つのグラフからわかるのは、

これらのことから、バックプロパゲーションによる学習は、 全体を一度に学習させることは難しく、 各出力の誤差が大きくなったり小さくなったりしながら、 全体としては徐々に教師信号との誤差を小さくしていくと考えられる。 バックプロパゲーションはその理論から学習進むと 学習毎に誤差が振動することも考えられるが、 この場合はまだその傾向は出ていない。

   figure383
図 5.1: 構成1のゲームの様子(ターゲットが見えている場合)

   figure391
図 5.2: 構成1のゲームの様子(ターゲットが見えていない場合)

   figure399
図 5.3: ターゲットが視野内にない場合の誤差の推移(構成1)

   figure407
図 5.4: ターゲットが視野内にある場合の誤差の平均の推移(構成1)



Deguchi Toshinori
Wed May 15 11:03:10 JST 2002