実際にゲームを開始し、内部記憶を持つニューラルネットワークでの学習において各教師信号をそれぞれ用いて学習させる。 その際に、実際にニューラルネットワークからの出力と教師信号との誤差を比較することで、学習の評価をする。 また、学習が100万回ごとに、その時の結合荷重としきい値を取り出しておく。 その値を用いて、新たな仕様のゲームを行なうことでも学習の評価をする。