next up previous contents
Next: 参考文献 Up: 無題 Previous: 教師信号No.3でのゲーム

結論

本研究では、内部記憶を持つニューラルネットワークを用いて、3つの教師信号を構成し、ゲームプレーヤーの時系列制御を行なった。

各教師信号における学習での、ニューラルネットワークからの出力と教師信号との誤差は3つとも目立って大きな値とならなかった。 これより、どの教師信号においても学習は成功していると言える。 しかし、本研究で新たに構成した教師信号No.2、No.3は、昨年の研究で成果を上げている教師信号No.1と比べて誤差は大きくなった。 学習はできているが、不安定なところが残ってしまった。

この原因は、教師信号No.1の「一番距離の近いターゲットを計算する」という単純な教師信号に比べて、教師信号No.2、No.3は「ターゲットの動きを予測」という複雑な教師信号を与えているので、学習がしづらくなった結果だと言える。 これを解決するには、教師信号の改善として、ターゲットの動きを予想する教師信号をもっと簡単に構成する必要がある。 また、プレーヤーの動きのパターン(移動速度など)を豊富にするなどのゲーム上の仕様を変えることでも良い結果がでる可能性もある。

視覚的評価では、各教師信号における学習結果を用いて、ゲームプレーヤーの制御を確認した。 3つの教師信号において構成した通りにゲームプレーヤーは制御できた。 本研究で構成した教師信号については、教師信号No.2はターゲット捕獲直前にプレーヤーの回転角度が急変化するという欠点が見られたが、ターゲット捕獲は可能であった。 教師信号No.3は、予想したターゲットを安定して捕獲することができた。 つまり、教師信号No.2に比べ、ターゲットの予測が正確になり、欠点もなくなった。 よって、本研究の目的である、教師信号に時間的な変化を考慮した場合のゲームプレーヤーの制御は可能であったと言える。

特殊ゲームにおける学習の評価では、ターゲットの捕獲効率を考えた場合、ターゲットの動きを予想をした教師信号の方が悪い結果となった。 結果だけ見れば、この学習は効果的ではないと思うが、あくまでゲーム上の結果であり、動きを予想できたという点では違う場面での活躍が期待できると言ってよい。

今後の課題としては、時間的な変化を考慮した教師信号の改善と、この教師信号におけるニューラルネットワークへの影響を詳しく調べることである。 また、この教師信号における学習結果を効果的に使える場面を調べることで、改善につながると言える。

謝辞

最後に、本研究を進めるに当たり、1年間多大な御指導を賜わりました 出口利憲先生に深く感謝すると共に、同研究室において助言をいただいた 専攻科の酒井哲平氏、今村豊治氏、また同研究室で共に学んだ、 石原直幸氏、加藤寛氏、豊吉隆一郎氏、古田彰吾氏に厚くお礼申し上げます。



Toshinori DEGUCHI
2004年 3月22日 月曜日 11時57分15秒 JST