過去1音だけの入力で次の音を予想するのは困難だと予想されるので、
入力層の素子数を20個にし、過去10音から次の音を出力できるようにした。
図(6.1)にこの実験で使用するニューラルネットワークの構造を示す。
これは、入力層が音の長さと高さ2つのニューロンが10対で計20個の素子があり、
中間層は50個で、
出力層は1つの音符を表すために2個の素子を使用している。
入力層には教師信号 を入力し、出力層の出力と
教師信号
とでバックプロパゲーションを行なう。
なお、使用する教師信号は先程も述べたように「カエルのうた」である。
この曲をニューラルネットに
15万回学習させた時の経過を図(6.2)に示す。
学習の結果、誤差は まで減少した。
もう少し学習回数を増やせば、
になるかもしれない。
しかし、音符の長さが
,音符の高さが
で
間違った量子化がされるので、
という値は、十分学習できたといえると考えられる。