Next: テキストマイニング Up: hayashi Previous: 目次目次

序論

近年、電子化された文書は増加の一途をたどっており、WWWの普及と相まって、これらの文書を手軽に入手することも可能になってきた。しかしながら、膨大な文書の中から欲しい情報を探したい、あるいは文書の集合を分析して傾向をつかみたいといった、利用者のさまざまな要求に十分対応できる情報アクセス手段はまだ乏しいのが現状である。

このような状況下で、研究開発が進み、世の中に普及し始めたのがテキストマイニングである。

テキストマイニングは、1997年のKDD(知識発見に関する国際会議)での R. Feldman によるチュートリアル、 1999年のACL(自然言語処理に関する国際会議)での M. Hearst による講演、 1999年のIJCAIにおける Feldman によるチュートリアルと併設のText Mining Workshopなどなど、著名な国際会議でその重要性は説かれている。

テキストマイニングはまだまだ未発達な部分が多く、キラーアプリケーションも確立していない。しかし、その必要性は大きく、とても人間が目を通すことのできないような、大量の文書でさえも、テキストマイニングを用いてコンピュータに処理させればあっという間にそれらの文書を分析することが可能になる。

本研究では、このテキストマイニングを利用して、本校電気情報工学科のシラバスの類似度を求めた。シラバスの類似度が高いと、その２つのシラバスは似通った内容を扱っていると言える。それはすなわち、ある教科の学ぶ内容はどの教科につながるのかを把握することができるということであり、これにより、学生は「これからこの教科を学ぶにはどのような知識が必要か」、「その知識はどの教科で得られるのか」を意識して授業に望むことができる。

Deguchi Lab. 2010年3月5日