next up previous contents
Next: 形態素解析 Up: 自然言語処理 Previous: 自然言語処理   目次

自然言語とは

自然言語処理の自然言語とは、コンピュータが認識できる言語として用いられる機械語(プログラミング言語)というのに対して、 人間が日常的に使っている言語を自然言語と呼び、区別している。 現在も自然言語について様々な研究が成されている。それはひとえに、コンピュータに自然言語を正しく処理させるのが難しいからであるが、 その原因の一つとして自然言語の曖昧性の高さが挙げられる。 機械語では、命令があった時にそれに対する動作は厳密に定められているので、 命令に対して、違う動作をしてしまっては困ることになる。ところが自然言語の場合、 例えばどこの高専出身か聞かれた時に「私は岐阜高専」と答えると、聞いた側は岐阜高専出身であることを理解する。 しかし、コンピュータに用いられているプログラミング言語では「私=岐阜高専」のように解釈されてしまいおかしくなってしまう。 さらに、「携帯電話」を指す語句を「携帯」と呼んでも、「PC」または「パーソナルコンピュータ」と呼んでもこれらが意味することは同じであり、 同一事物を指す語句が数多く存在するという点も、機械語とは大きく異なっている。 また、「しっかりした大きな男の家」という文があった時に、コンピュータには「その家が大きいのか」、「男が大きいのか」、 「家がしっかりしているのか」、「男がしっかりしているのか」のような形容詞と名詞の修飾関係を理解することが難しい。

このように、自然言語は多義性や類義性という言葉のゆらぎと引き換えに表現力や柔軟性が高く、 その点が文学の成り立つ要素になっていると言える。 その一方で、一意的な解を扱うことが得意なコンピュータに、多義語や類義語のように曖昧なものを処理させるのは容易でなく、 この曖昧さが自然言語処理を難しくする要素の一つにもなっている。 また、文脈やその場の雰囲気、加えて相手の表情などからも適切な解釈を行う必要もあり、 その解釈を間違うことは私たちが生活を送る中でもままあることだが、これをコンピュータに処理させようとするにはいまだ課題が残っている。



Deguchi Lab. 2013年2月28日