学習後の移動距離の出力誤差を図 6.5 に示す。
内部記憶を用いた方は、100万回から4000万回まで さしたる変化はなく、低い誤差で安定している。 また、わずかながら学習が進むにつれ、誤差を少なくなっていることも 読みとれる。 このことから、100万回で誤差は収束はほぼ完了しているのではないかと 考えられる。 また、学習時の移動距離の出力誤差と比べると誤差の値が増加しているが、 これはまた新たにゲームを開始することによる、 学習した時までの内部記憶データの消失によるものだと考えられ、 適当な値を用いるだけでは学習の成果が十二分に発揮できないことがわかる。
内部記憶を用いない方は、内部記憶を用いた方に及ばないものの、 学習回数に応じての誤差の減少は見ることができる。 しかし、振動が激しく、また内部記憶を用いた方は100万回ですでに 誤差が収束していたのに比べ、はるかに収束が遅い。 また、学習時の誤差と比べると同様に約1000万回の後に2つの山が 見てとれる。