3.1.2 階層型ネットワーク

Next: 3.2 ニューロンの学習 Up: 3.1 ネットワークモデル Previous: 3.1.1 相互結合型ネットワーク

3.1.2 階層型ネットワーク

続いて、階層型ネットワークを概念的に示すと図 3.3 のような構成になる。

このネットワークでは、複数のニューロンがグループ化されて一つの層を形成していると考える。そして、各層は直列に連なって階層を形成するわけである。ここである層のニューロンは、隣りの層のニューロンのみから情報を受け、別隣りにある層のニューロンのみへと単方向に情報を送るように結合されている。つまり、層をまたいだ結合や逆向きに伝わる結合はない。そのため、情報の流れはどこでも一方通行となっており、情報はフィードバックされない。

ネットワークへの入力を扱う初めの層を入力層といい、ネットワークからの出力を扱う終端の層を出力層という。また、その間の内部にある層を中間層という。

図 3.3: 階層型ネットワーク

一般に中間層の数が多いほどネットワークの能力は高い。その例として、中間層の数によるネットワークの線形分離能力の違いを図 3.4 に示す。 [5]

これは、連続値モデルの普通のニューロンを用いて、二つの入力 x, y と一つの出力 z をもつネットワークを構築したものである。出力は二つの入力のみによってきまるので、その動作は３次元空間における曲面 z = f(x,y) で表現できる。教師信号として０または１を与えて学習させた場合、ネットワーク全体でその曲面を近似するわけである。

ここで、中間層がないネットワークでは曲面は平面で近似する能力しか持たない。そのため、出力が１( 0.5)（色の濃いところ）の部分と０(< 0.5)（白いところ）の部分との境界は、直線にしかならない。よって、１となる領域が分散している場合など、典型的な XOR 問題などは解決できないわけである。

中間層が一つあれば XOR 問題は解決できるようになるが、まだ噛み合った領域を分離することはできない。中間層が二つあれば噛み合った領域でさえも分離することが可能になり、さらに中間層を増やすことで、より教師信号に忠実な反応ができるようになることは容易に想像できる。

実際には、中間層をいたずらに増やしてもただ無駄になるだけなので、目的に見合った必要最低限の中間層を設けるわけである。

図 3.4: 中間層の数による線形分離能力の違い

Deguchi Toshinori
1998年04月01日 (水) 12時03分23秒 JST