next up previous contents
Next: 類似技術との比較 Up: テキストマイニング Previous: テキストマイニング   目次


テキストマイニング [2]

テキストをマイニングすることである。マイニングとは発掘のことであり、掘り返してお宝を探し当てることを意味する。テキストとは、文書という意味であり、小説や新聞あるいはブログ、メールなどのことである。マイニングによって発見しようとするのは、収集したテキストに共通する話題であったり、テキストを書いた人の癖であったり、テキストデータに埋もれている法則性や相関関係などのことである。その発見をどのようにいかすかは「分析」する側の仕事だが、テキストの山に隠されているものを明るみに出してくれる技術がテキストマイニングである。しかし、この言葉の定義は未だに曖昧である。世の中で普及してきているテキストマイニングのツールも多種多様であり、それぞれの機能が異なっている。共通している点は、膨大な文書データの有効活用を目的としている点である。



Deguchi Lab. 2012年3月9日