構成1のニューラルネットワークを前述のように学習させ、動作させた。 ゲームの様子はターゲットが見えている場合と 見えていない場合に分けて、 図 5.4と 図 5.4に示した。 両図は1600万回学習させたニューラルネットワークによるものである。 ターゲットが見えている時は、入力されている一番近くのターゲットに反応し、 そのターゲットの正面を向き前進していることが 図 5.4よりわかる。 また、ターゲットが見えていない時は、 図 5.4より、 [rad]ずつその場で回転してしていることがわかる。 このことから、教師信号がうまく ニューラルネットワークに学習されたといえる。 教師信号には加算やifの構文が含まれていたことから、 ニューラルネットワークには加算や簡単な状況判断が出来ることが確認できた。
図 5.4と図 5.4は 教師信号とニューラルネットワークの 出力との誤差と学習回数の関係を示している。 ここでの誤差は教師信号と出力の差の絶対値のことをいう。 この2つのグラフからわかるのは、
図 5.1: 構成1のゲームの様子(ターゲットが見えている場合)
図 5.2: 構成1のゲームの様子(ターゲットが見えていない場合)
図 5.3: ターゲットが視野内にない場合の誤差の推移(構成1)
図 5.4: ターゲットが視野内にある場合の誤差の平均の推移(構成1)