next up previous contents
Next: データ整理 Up: morishita Previous: 結果   目次

LSAによる類似度計算

実験1のネットワーク分析による結果を見ると、基準が明確で無い為に類似しているかどうかはわかるが、類似度はわからない。 そこで本章では、良好な計算結果を示すと言われているLSAを利用して類似度計算を行う。 さらにその結果を視覚的に分かりやすくするため、多次元尺度法によって二次元散布図を作成する。 そして、この二次元散布図と実験1のネットワーク図を比較し考察する。 今回の実験手順は以下の通りになる。

  1. Xpdfによるシラバスのテキスト化
  2. MeCabによる形態素解析
  3. シラバス特有の単語を除去
  4. テキスト中の記号や語句の置換
  5. シラバスと用語の行列生成
  6. 主成分数の導出と近似行列の生成
  7. ベクトル空間法による類似度を計算
  8. 多次元尺度法による視覚的に類似度を比較



Subsections

Deguchi Lab. 2013年2月28日