Next:
序論
Up:
yoshimura
Previous:
yoshimura
目次
序論
テキストマイニング
テキストマイニング [2]
自然言語処理
形態素解析
重要度の計算方法
実験に関する手法
主成分分析 [6,7]
潜在的意味解析 [6,8]
ベクトル空間法
2値化処理 [9]
モード法
確率的潜在意味解析 [10]
実験1 : 用語の重要度を考慮しない類似度計算
データ準備
Xpdfによるシラバスのテキスト化
MeCabによる形態素解析 [3]
TermExtractによる用語抽出 [14]
ベクトル空間法の実行と2値化処理
実験結果
実験2 : LSAを用いた類似度計算
データ整理
テキスト中の記号の置換
特別な用語の登録
シラバスと用語の行列生成
主成分数の導出と近似行列の生成
ベクトル空間法の実行と2値化処理
実験結果
実験3 : PLSAを用いた類似度計算
データ準備
ベクトル空間法の実行と2値化処理
実験結果
結論
参考文献
実験で使用したプログラム
LSA
PLSA
Deguchi Lab.
2011年3月4日