教師信号No.1での学習回数4000万回を図 6.6 に示す。 教師信号No.1は「一番距離の近いターゲットを捕獲することを理想出力」とする信号であった。 プレーヤーは t=0 で一番距離の近いターゲットを捉えている。 しかし、t=3 で一番距離の近いターゲットが入れ替わるので、目標を変えている。 後はそのターゲットを追いかけて、t=6 で捕獲している。