Next:
序論
Up:
ito
Previous:
ito
目次
序論
テキストマイニング
テキストマイニング [2]
類似技術との比較
自然言語処理
自然言語とは
形態素解析
自然言語の難しさ
自然言語の精度と意義
重要度の計算方法
実験で使用した技術
主成分分析[6][7]
潜在的意味解析[6,9]
ベクトル空間法[9]
2値化処理[10]
実験1:用語の重要度を考慮しない類似度計算
データ準備
Xpdfによるシラバスのテキスト化
テキストファイルの前処理
Mecabを用いて形態素解析
TermExtractによる用語抽出
ベクトル空間法の実行と2値化処理
実験結果
実験2:LSAを用いた類似度計算
データ整理
シラバスと用語の行列生成
LSAについて
ベクトル空間法の実行と2値化処理
実験結果
結論
参考文献
Deguchi Lab.
2012年3月9日