ニューラルネットワークの歴史は、1943年のマッカロとピッツ(McCulloch,Pitts)が神経細胞のモデルを提案したことに始まる。[2] 1949年、ヘッブ(Hebb)は、神経細胞が興奮したときに入力部のシナプス結合のうち、刺激を伝えたものは結合強度が増加し、さらに刺激が伝えやすくなっているという説を唱え、これが神経回路``可逆性''をもたらし、認識や記憶のもとになっていると主張した。ローゼンブラッドは1950年代の終わりに、これからの原理に基づいたパターン学習をするパーセプトロンを作った。1969年にミンスキー(Minsky)とパパート(Papert)によりパーセプトロンの限界が呈示されたが、1986年にラメルハート(Rumelhart)、ヒントン(Hinton)、ウイリアムス(Williams)によりまとめられた階層型ニューラルネットワークの誤差逆伝播法(back propagation)の定式化などを経て、近年は脳の機能の実現を強く意識した研究も盛んにおこなわれている。[8]
本研究ではオセロまたはリバーシと呼ばれるゲームの盤面評価にこのニューラルネットワークを用い、既存の棋譜データからの学習を試みる。64マスの盤面の状態を単純にニューラルネットワークに入力し、中間層の数を変化させた場合の学習の進み具合、また各学習方法についての効率の検証を行う。