next up previous contents
Next: 石の位置による評価 Up: 無題 Previous: 学習方法2(後ろ向き演算)

評価理論

本研究は、オセロの盤面評価をパーセプトロンを用いて作成するということである。 この章では、その盤面評価とはどのようなものかについて説明する。

まず、オセロのAIの流れについて簡単に説明する。 オセロのAIは、人同士で対戦するときの考え方と多くの点で似ている。 まず人間の考え方について考えてみる。人が考える場合、個々によって考え方に違いはあるだろうが、大まかには以下のように考える。

この手順の1番目と2番目は、コンピュータ上では探索アルゴリズムと評価関数にあたる。 オセロプログラムの強さとは、ほとんどこの評価関数できまり、いくら高速な探索アルゴリズムを作り上げたところで評価関数が駄作であれば意味が無い。

評価関数が完璧であるならば、1手先を読むだけで最善手が分かるが、それを実現するには無理がある。 いかにして完璧な状態に近づけるかが、評価関数の性能であるといえる。





Deguchi Lab.