教師信号No.3での学習回数4000万回を図 6.8 に示す。 教師信号No.3は「ターゲットの方向ベクトルより一番早く、効率良く捕まえられるものを予測して捕獲することを理想出力」とする信号であった。 t=0 において目標のターゲットを決めると、後は回転角度を補正して、ほぼそのままの角度でターゲットを捕獲している。 教師信号No.2と違って、急激な角度の変化もなく捕獲できている。 これはターゲットの持つ細かい情報を元に、動きを予想しているのでこのような結果となったといえる。
前節では教師信号No.2、No.3においての出力誤差が大きくなってしまったが、この結果よりプレーヤーはターゲットの動きを予測した動きができていた。 ゲームプレーヤーの時系列制御という点では成果を上げることができた。
図 6.6: 教師信号No.1における学習4000万回のゲームの様子
図 6.7: 教師信号No.2における学習4000万回のゲームの様子
図 6.8: 教師信号No.3における学習4000万回のゲームの様子