next up previous contents
Next: 形態素解析 Up: テキストマイニング Previous: テキストマイニング   目次


自然言語処理

コンピュータが認識出来る言語を機械語と呼ぶが、それとは逆に我々が日常生活で使用している言語を自然言語と呼ぶ。我々が何気なく使っているこの言語をコンピュータに認識・処理させる技術を自然言語処理(Natural Language Processing)と呼び、現在も様々な研究が成されている。それはひとえに、コンピュータに自然言語を正しく処理させるのが難しいからであるが、その原因の一つとして自然言語の曖昧性の高さが挙げられる。

機械語ではある命令があった時、それをいつでも正しく実行出来るように、その命令に対応する動作は厳密に定められている。極端な話としてプログラム上で「Aに1を足せ」という命令があった時に、「aから1を足す」ようなことがあっては困るのである。ところが我々の場合には、例えば「マウスを買う」という文があった時に、これをコンピュータの周辺機器の1つとして認識しても、哺乳類ネズミ目の動物として認識しても、意味としては通ってしまう。また、「人間の感覚に代わって温度・圧力・磁気・光・ガス・超音波・電磁波などを検知・検出する器具」を指す語句を「検知器」と呼んでも、「センサ」または「センサー」と呼んでもこれらが意味することは同じであり、同一事物を指す語句が数多く存在するという点も、機械語とは大きく異なっている。

このように、自然言語は多義性や類義性という言葉のゆらぎと引き換えに表現力や柔軟性が高く、その点が文学の成り立つ要素になっていると言える。その一方で、一意的な解を扱うことが得意なコンピュータに、多義語や類義語のように曖昧なものを処理させるのは容易でなく、この曖昧さが自然言語処理を難しくする要素の一つにもなっている。 また、文脈やその場の雰囲気、加えて相手の表情などからも適切な解釈を行う必要もあり、その解釈を間違うことは私たちが生活を送る中でもままあることだが、これをコンピュータに処理させようとするにはいまだ課題が残っている。



Subsections

Deguchi Lab. 2011年3月4日