序論

様々な情報が混在し、雑音で汚れている実世界の観測情報から、本質的な情報やある課題に必要な情報を抽出し、処理しやすいように表現することは、人工知能やパターン認識を始めとする知的情報処理における古くからの研究課題の一つである。 この課題に対して、これまでに様々なアプローチでの研究が行われてきたが、近年、層の数が多い階層的なニューラルネットワーク(deep neural network)によってデータから抽象度の高い表現を獲得させる方法が深層学習(deep learning)として脚光を浴びている。 そこで得られた表現を用いた手法が、一般物体認識、連続音声処理、自然言語処理、化合物の活性予測、など様々なコンペテイションやベンチマークタスクで従来法を大きく引き離す性能を叩き出していることがその直接的な理由である。 層の数が多いニューラルネットワークをうまく学習させるためのアイディアとして、タスクに応じた結合構造をあらかじめ作り込むことで、結合重みの自由度を減らし、学習を容易にするというものがある。こうしたネットワークの例としては、福島やLeCunによって、手書き文字の認識のために考案されたものがよく知られており、現在では、畳み込みニューラルネットワーク(convolution neural network)と呼んでいる[1]。

深層学習は、アカデミックよりも産業界で先に利用が急速に利用が広がっており、Microsoftが音声認識への適応を進め、Googleも画像認識など、従来手法から深層学習を利用した手法に次々と置き換えている[2]。 各企業が人工知能の開発競争に加わっている中、2015年11月にGoogleが機械学習用の計算フレームワークである、TensorFlowをオープンソースで公開した[3]。 これはフリーライセンスであり、以下の利点が考えられる。

以上の利点から、TensorFlowには多大な将来性があると判断した。

本研究では、オセロまたはリバーシと呼ばれるゲームの既存の棋譜データから、各手数での盤面評価を行う畳み込みニューラルネットワークをTensorFlowを用いて構築する。 TensorFlowはニューラルネットワークの歴史から見るとまだ日が浅く、未だ文献が充実しているとは言い難いため、先ずはTensorFlowを用いてデータを扱うことを第一目標とする。 また、従来のパーセプトロンと畳み込みニューラルネットワークの誤差の比較、学習の最適化手法であるドロップアウトを設定することによりどれほどの誤差の減少が図れるかについての検証を行う。



Deguchi Lab. 2017年3月6日