まず、ターゲットの数は10とし、それぞれにランダム関数を用いて初期座標、 初速度、角度を与える。 プレーヤーの初期座標、および初期視野角度も同様に、ランダムな値を与える。 ターゲットがある単位時間に捕獲された場合、その捕獲された数だけのターゲットが、 次の単位時間に再びランダムな初期座標、初速度、角度を与えられ、復活することとする。 つまり、いかなる1単位時間開始時ををとっても、ターゲットの数は常に10である。 これをあらかじめ決めておいた学習回数だけ時間を進め、 繰り返すということになる。