教師信号No.3でのプレーヤーの動きを図 6.9に示す。 教師信号No.3は「ターゲットの方向ベクトルより一番早く、効率良く捕まえられるものを予測して捕獲することを理想出力」とする信号であった。 これより、t=0で目標ターゲットにを決めると、回転角度を補正して、急激な回転もせずターゲットを捕獲できている。 これらのことから、遅れ時間2の遅れ学習でプレーヤーをうまく学習させていることが分かった。 遅れ時間2の遅れ学習を用いたゲームプレーヤーの時系列制御という点で成果を上げることができた。
図 6.9: 教師信号No.3におけるゲームの様子