Next: 5.3 構成3 Up: 第5章実験結果 Previous: 5.1 構成1

5.2 構成2

構成2では前述のように4種類の、入力中間層の組合せによるニューラルネットで、学習とその結果について比較検討した。

100万回学習した構成2-Aによるゲームの様子を図 5.6と図 5.6に、同じ構成で4000万回学習したものによるゲームの様子を図 5.8と図 5.8に示した。

図 5.6と図 5.8では、 t=1でプレーヤーの左にある一番近いターゲットを捉え左回転と前進をし、両方ともt=3で1つ目のターゲットを捕らえることに成功した後、2つ目のターゲット方へ回転し追跡していることがわかる。つまり、ターゲットが見える場合の動作はうまく学習できたといえる。また、100万回と4000万回でターゲットを見ている時の基本的な動作の違いはなく、学習回数による変化はほとんど見られない。この場面以外では、ターゲットが遠くの端の方に入った場合に、 100万回では学習回数が少ないためか見逃してしまうことがあったが、 4000万回では端の方にあるターゲットも反応できていた。

期待していた、ターゲットが3つ視野の中に入ってきた場合の動作は、はっきりとした成果はなかった。しかし、100万回の時には3つターゲットを捉えた瞬間にあらぬ方向へ回転してしまったり、あとずさりしてしまったりしていたのが、 4000万回になると、動作が不安定になるもののあらぬ方向を向いてしまうことはなくなった。これは、学習回数を重ねることで教師信号から遠い動作の余地が少なくなったためと考えられる。

学習回数が少ない場合と多い場合で差が出たのは、ターゲットが視野の中にいない場合の動作で、図 5.6と図 5.8をみると4000万回の方が100万回より教師信号である [rad]に近い回転をしているのがわかる。

図 5.11から図 5.17には、動作の出力や誤差の学習回数による推移をまとめた。

図 5.11と図 5.11のターゲットが視野の中にない場合の出力を見ると全く学習できていないもの、動作ごとや入力の違いで学習の得手不得手があることなどがわかる。

図 5.11では、教師信号は0であったが、他の教師信号に影響され全ての組合せ、学習回数で常に30が出力され学習できていない。

回転角度と移動方向は、学習回数を重ねるごとに教師信号に近づいていったが、移動方向は入力が1,0のものが、回転角度は中間層が200のものの方が学習に有利であることが図 5.11と図 5.11 よりわかる。ターゲットが視野の中にいないと全ての入力が0となり、常に一定値を出力するべき移動方向には有利に働き、中間層が多いと複雑な回転角度に関する処理に有利に働くと考えられる。

ターゲットが見えている場合は、ターゲットが1つの時と 2つの時に分けて全ての入力の誤差を平均することで学習の傾向を調べた。

図 5.14と図 5.17の移動方向はどんな入力でも一定値0を出力しなければならないが、やはり入力が1,0のBとDは全く誤差なく出力出来ているのに対して、入力が1,-1のAとCは学習回数が増えると共に誤差が小さくなるものの一定の誤差が残った。

図 5.14と図 5.17の移動距離は、ターゲットが視野内にあれば30を出力し誤差もほとんどないが、ターゲットが無い時には教師信号が0なのに図 5.11より 30を出力させてしまっており例外の処理が出来ていないことがわかる。

回転角度は図 5.14 より、誤差の平均は0にならずある一定の値に漸近している。この誤差は0.5[rad]程度、つまり [rad]ほどの誤差が残っていることになる。しかし、実際のゲームを見ると正面に捉えたターゲットほどしっかりと追っているので、この値は端の方にターゲットがある時の誤差が大きいことを示している。教師信号は正面に近い素子からの信号を優先しているので、こうなったと考えられる。ゲームの内容を見れば、回転角度は最も複雑な処理で一番近いターゲットによって角度を選択しなければならないが、ゲームを進めていく上では必ずしも確実に教師信号どおりの出力を得る必要はないということがわかる。このことは、一般の情報処理で精度を必要としないものであればある程度はニューラルネットワークが担えることを示していると考えられる。