構成1のニューラルネットワークを前述のように学習させ、動作させた。
ゲームの様子はターゲットが見えている場合と
見えていない場合に分けて、
図 5.4と
図 5.4に示した。
両図は1600万回学習させたニューラルネットワークによるものである。
ターゲットが見えている時は、入力されている一番近くのターゲットに反応し、
そのターゲットの正面を向き前進していることが
図 5.4よりわかる。
また、ターゲットが見えていない時は、
図 5.4より、
[rad]ずつその場で回転してしていることがわかる。
このことから、教師信号がうまく
ニューラルネットワークに学習されたといえる。
教師信号には加算やifの構文が含まれていたことから、
ニューラルネットワークには加算や簡単な状況判断が出来ることが確認できた。
図 5.4と図 5.4は 教師信号とニューラルネットワークの 出力との誤差と学習回数の関係を示している。 ここでの誤差は教師信号と出力の差の絶対値のことをいう。 この2つのグラフからわかるのは、
図 5.1: 構成1のゲームの様子(ターゲットが見えている場合)
図 5.2: 構成1のゲームの様子(ターゲットが見えていない場合)
図 5.3: ターゲットが視野内にない場合の誤差の推移(構成1)
図 5.4: ターゲットが視野内にある場合の誤差の平均の推移(構成1)