構成2では前述のように4種類の、入力 中間層の組合せによる
ニューラルネットで、学習とその結果について比較検討した。
100万回学習した構成2-Aによるゲームの様子を 図 5.6と 図 5.6に、 同じ構成で4000万回学習したものによるゲームの様子を 図 5.8と 図 5.8に 示した。
図 5.6と 図 5.8では、 t=1でプレーヤーの左にある一番近いターゲットを捉え 左回転と前進をし、両方ともt=3で1つ目のターゲットを捕らえることに 成功した後、2つ目のターゲット方へ回転し 追跡していることがわかる。 つまり、ターゲットが見える場合の動作はうまく学習できた といえる。 また、100万回と4000万回でターゲットを見ている時の 基本的な動作の違いはなく、 学習回数による変化はほとんど見られない。 この場面以外では、 ターゲットが遠くの端の方に入った場合に、 100万回では学習回数が少ないためか 見逃してしまうことがあったが、 4000万回では端の方にあるターゲットも反応できていた。
期待していた、ターゲットが3つ視野の中に入ってきた場合の動作は、 はっきりとした成果はなかった。 しかし、100万回の時には3つターゲットを捉えた瞬間にあらぬ方向へ 回転してしまったり、あとずさりしてしまったりしていたのが、 4000万回になると、動作が不安定になるものの あらぬ方向を向いてしまうことはなくなった。 これは、学習回数を重ねることで教師信号から遠い動作の余地が 少なくなったためと考えられる。
学習回数が少ない場合と多い場合で差が出たのは、
ターゲットが視野の中にいない場合の動作で、
図 5.6と
図 5.8を
みると4000万回の方が100万回より
教師信号である [rad]に近い回転を
しているのがわかる。
図 5.11から 図 5.17には、 動作の出力や誤差の学習回数による推移をまとめた。
図 5.11と 図 5.11の ターゲットが視野の中にない場合の出力を見ると 全く学習できていないもの、 動作ごとや入力の違いで学習の得手不得手があることなどがわかる。
図 5.11では、 教師信号は0であったが、他の教師信号に影響され 全ての組合せ、学習回数で常に30が出力され 学習できていない。
回転角度と移動方向は、 学習回数を重ねるごとに教師信号に近づいていったが、 移動方向は入力が1,0のものが、 回転角度は中間層が200のものの方が 学習に有利であることが 図 5.11と 図 5.11 よりわかる。 ターゲットが視野の中にいないと全ての入力が0となり、 常に一定値を出力するべき移動方向には有利に働き、 中間層が多いと複雑な回転角度に関する処理に 有利に働くと考えられる。
ターゲットが見えている場合は、ターゲットが1つの時と 2つの時に分けて全ての入力の誤差を平均することで 学習の傾向を調べた。
図 5.14と 図 5.17の 移動方向はどんな入力でも一定値0を出力しなければならないが、 やはり入力が1,0のBとDは全く誤差なく出力出来ているのに対して、 入力が1,-1のAとCは学習回数が増えると共に誤差が小さくなるものの 一定の誤差が残った。
図 5.14と 図 5.17の移動距離は、 ターゲットが視野内にあれば30を出力し誤差もほとんどないが、 ターゲットが無い時には教師信号が0なのに 図 5.11より 30を出力させてしまっており 例外の処理が出来ていないことがわかる。
回転角度は図 5.14
より、誤差の平均は0にならずある一定の値に漸近している。
この誤差は0.5[rad]程度、つまり [rad]ほどの
誤差が残っていることになる。
しかし、実際のゲームを見ると正面に捉えたターゲットほどしっかりと
追っているので、この値は端の方にターゲットがある時の
誤差が大きいことを示している。
教師信号は正面に近い素子からの信号を優先しているので、
こうなったと考えられる。
ゲームの内容を見れば、
回転角度は最も複雑な処理で一番近いターゲット
によって角度を選択しなければならないが、
ゲームを進めていく上では必ずしも確実に
教師信号どおりの出力を得る必要はないと
いうことがわかる。
このことは、一般の情報処理で精度を必要としないものであれば
ある程度はニューラルネットワークが担えることを
示していると考えられる。
ターゲットが1つの場合と2つの場合の差異は グラフ上ではほとんど見られなかったが、 ゲームを観察すると実際には回転角度に関しては ターゲットが1つの場合と2つの場合で 反応が微妙に違っているのがわかり、 誤差の平均はその違いを必ずしも正確には表していないことを 付け加えておく。
図 5.5: 100万回学習した構成2-Aのゲームの様子(ターゲットが見えている場合)
図 5.6: 100万回学習した構成2-Aのゲームの様子(ターゲットが見えていない場合)
図 5.7: 4000万回学習した構成2-Aのゲームの様子(ターゲットが見えている場合)
図 5.8: 4000万回学習した構成2-Aのゲームの様子(ターゲットが見えていない場合)
図 5.9: ターゲットが視野内にない場合の回転角度の出力の推移(構成2)
図 5.10: ターゲットが視野内にない場合の移動距離の出力の推移(構成2)
図 5.11: ターゲットが視野内にない場合の移動方向の出力の推移(構成2)
図 5.12: ターゲット1つが視野内にある場合の回転角度の誤差の平均の推移(構成2)
図 5.13: ターゲット1つが視野内にある場合の移動距離の誤差の平均の推移(構成2)
図 5.14: ターゲット1つが視野内にある場合の移動方向の誤差の平均の推移(構成2)
図 5.15: ターゲット2つが視野内にある場合の回転角度の誤差の平均の推移(構成2)
図 5.16: ターゲット2つが視野内にある場合の移動距離の誤差の平均の推移(構成2)
図 5.17: ターゲット2つが視野内にある場合の移動方向の誤差の平均の推移(構成2)