next up previous contents
Next: Xpdfを用いてpdfをテキスト化 Up: 実験 Previous: 実験結果について   目次


実験1:ベクトル空間法による類似度の計算

実験1では、日本語Wordnetや主成分分析、潜在的意味解析を用いずに、単純にシラバスの重要語と重要度を計算し、それらを元にベクトル空間法を用いて類似度を計算する過程および結果を述べる。

本研究の調査対象のシラバスは本校電気情報工学科の専門科目とし、実験を簡単にするため「応用数学A」のような一般科目は省略した。 処理の流れとしては以下のようになる。

  1. Xpdfを用いてpdfをテキスト化
  2. MeCabを用いて形態素解析
  3. TermExtractを用いて重要語の抽出および重要度を計算
  4. 重要語からシラバス特有の単語を除去
  5. termmiを用いて類似度を計算



Subsections

Deguchi Lab. 2012年3月12日