Next: Hearstによるテキストマイニングの定義 Up: テキストマイニング Previous: テキストマイニング目次

テキストマイニングとは

テキストマイニングという言葉は1990年代半ばから世の中に広まり始め、近年では既に目新しいものではなくなっている。しかし、この言葉の定義は未だに曖昧である。世の中で普及してきているテキストマイニングのツールも多種多様であり、それぞれの機能が異なっている。共通しているのは、膨大な文書データの有効活用を目的としている点であろう。したがって、広義のテキストマイニングには文書データを活用する技術全般が含まれ、例えば検索技術もテキストマイニングに位置づけられることがある。

本研究では、シラバスの類似度を調べるので、分析の技術としてテキストマイニングを用いる。分析の技術としてのテキストマイニングは、文章中で表現されている意味を分析の対象とする。文書の内容がどのようなことを扱っているのかを調べ、また、その扱っている内容が文書群全体で多いか少ないか、増えているか減っているか、他の内容と関連が強いか弱いかといった統計的な分析を行うのが本研究のテキストマイニングである。

**表 2.1:** データマイニングとテキストマイニングの分類
$\scalebox{0.8}{ \begin{tabular}{\vert c\vert c\vert c\vert c\vert}\hline &\mul... ...��のテキストデータマイニング&情報検索\\ \hline \end{tabular} }$

Deguchi Lab. 2010年3月5日