TensorFlowを用いて作成したパーセプトロン、畳み込みニューラルネットワークにそれぞれ10ゲームの棋譜から得られた約600手のデータをそれぞれのニューラルネットワークに入力し、10,000回の学習を行うことで、学習誤差にどれほどの差が出るかを調べる。
テストデータは10手目、20手目、30手目、40手目、50手目の盤面状態とそれぞれの教師信号とする。
パーセプトロンは、入力層、中間層、出力層の計3層から構成されているものとし、中間層の数は15個である。畳み込みニューラルネットワークは、ドロップアウトを設定していないものとする。
重み、バイアス、学習係数の初期条件は双方共通である。
- 重み : 標準偏差0.1の切断正規分布
- バイアス : 標準偏差0.1の切断正規分布
- 学習係数 : 0.0001
Deguchi Lab.
2017年3月6日