本研究では、仮想二次元平面空間におけるゲームを設定し[5]、教師信号に時間的な変化を考慮した場合のニューラルネットワークへの影響を調べる。 ゲームの様子を図 6.4に示す。 このゲームでは、正方形のフィールド上をターゲットは縦横無尽に走り回り、プレーヤーはそのターゲットを捕獲する。
最初は結合加重がランダムなニューラルネットなのでプレーヤーはランダムな動作しかしない。
それをいかに学習させ理想的な動作、教師信号に近付けるかがこの実験の目的となる。
コンピュータの1ドットを1ピクセルとしたとき、
フィールドは ピクセルの広さを持つ。
プレーヤーは自分とターゲットを座標的に重ねることで、ターゲットを捕獲する。
プレーヤーは二次元平面空間の視覚からニューラルネットへの入力を作成することができ、出力からプレーヤーの移動、または回転の制御を行なう。