Next: 3.2 プレーヤー Up: 第3章ゲーム Previous: 第3章ゲーム

3.1 ゲームのルール

この研究は、ニューラルネットワークに実空間に近いゲームを設定して、学習と実行を試みる。ゲームは、この研究のために用意したものを使用する。

ルールは、正方形のフィールド上を動き回るターゲットをプレーヤーがターゲットと重なることで「捕獲」したこととしこれを繰り返し全て捕獲すると終りという単純なもので、プレーヤーは単位時間ごとに環境からの入力と、それによる出力を繰り返す。操作は、プログラムやニューラルネットワークを用いる。

プレーヤーの大きさは半径30で、その視野は角度 [rad] 距離200に限定されている。ただし、単位距離はコンピュータの画面上のドットを1とし、単位は[pixel]とする。プレーヤーには視野の中にあるターゲットの情報が提供され、それを前処理するなどしてニューラルネットワークなどに入力することができる。提供される情報はプレーヤーを中心にした時、ターゲットの

距離
角度
遠ざかる速さ
角速度

でそれぞれのニューラルネットワークで必要な情報を抽出する。速さは、

をある時点でのターゲットが遠ざかる速さもしくは角速度として、また

をある時点でのターゲットの距離もしくは角度とすると、

とそれぞれ計算する。

ターゲットは、初速での等速直線運動を続け、フィールドの端まで来ると跳ね返るという動作を繰り返す。ターゲットに、もう少し変化のついた動作をさせることもできたが、変化をつけるとプレーヤーへの入力に入りきらない情報もターゲットの動作の決定を左右することにる。したがって、与えられた情報だけをたよりに動作する今回のニューラルネットワークは、ターゲットに予期せぬ変化があるとうまく学習できたか評価できないという性質上、ターゲットの動作に変化をつけることは無意味であるのでしなかった。

図 3.1: ゲーム

Deguchi Toshinori
Wed May 15 11:03:10 JST 2002