next up previous contents
Next: 参考文献 Up: 無題 Previous: ゲーム時における視覚的評価

結論

本研究では、内部記憶を用いた学習を行ない、それによるゲームの時系列的な 制御を試み、また同時に内部記憶を用いない学習を同様の条件下で行ない、 両者の比較を行なった。

学習の結果、内部記憶を用いた学習を行なうことによって、 ゲームの時系列的制御は可能であることがわかった。 しかし、完璧に学習が行なえたというわけではなく、 ある程度の誤差を残した学習であった。 移動距離の誤差は、教師信号と比べ、見ためには全然わからないほどの ほぼ文句のない出来ではあったが、 回転角度は約 tex2html_wrap_inline3367 [rad]の誤差が最後まで残り、 ゲーム上でたまに少し不安定な所を見せたりした。

これを改善する手段としては、教師信号の与え方をターゲットの動きを予測した ものにしたり、その時間までの時間的な推移からより適したものにする、 といったものが考えられる。

また、今回用いた回転角度の信号の出力変換幅が広いために、 細かい誤差でも大きく角度が変わるせいで学習に影響が出たことも 十分に考えられるため、 変換幅を変えてみたり、 また、プレーヤーの行動パターンも再考することによって さらなる改善が得られる可能性もある。

内部記憶を用いない学習との比較は、明らかな差が認められた。 内部記憶を用いない学習では全く学習できていない項目があり、 対して内部記憶を用いた構成は、移動距離、回転角度ともにある程度の学習が できていた。 また、学習による出力誤差の収束も、内部記憶を用いる構成では 100万回前後でほぼ完了していたのに対し、 内部記憶を用いない構成では1000万回以降であったりするなど、 学習の早さにも影響が見られた。

これらのことから今回、内部記憶による学習への影響は、少なからず良い方向へと 向かったことがわかる。

しかし、内部記憶を用いた場合に学習後の動作を行なおうとすると、 内部記憶層への初期入力を十分に考慮しなければ、 学習の成果を十分に発揮できない可能性も発見できた。 今回はゲームを空回しすることによって、適当な値を初期入力としたが、 その値を学習時のものを用いるなど、 何らかの方法で的確な値を用いてゲームを行なえば 学習の成果がより良く出た可能性もある。

全体としての今後の課題としては、 ゲームでの最適な行動パターン及び教師信号の検討、 内部記憶による学習への影響をさらに詳しく調べる、 などが挙げられる。

謝辞

最後に、本研究を進めるに当たり、1年間多大な御指導を賜わりました 出口利憲先生に深く感謝すると共に、同研究室において助言をいただいた 専攻科の岩佐要氏、高木潤氏、酒井哲平氏、また同研究室で共に学んだ、 今村豊治氏、加藤智也氏に厚くお礼申し上げます。



Toshinori DEGUCHI
2003年 4月23日 水曜日 17時55分23秒 JST