next up previous contents
Next: データ整理 Up: morishita Previous: 多次元尺度法   目次

実験1:ネットワーク分析による類似度計算

実験1では、主成分分析、潜在的意味解析を用いずに、シラバスをNgram解析し、 それを元にネットワーク分析する。 さらにそれを、ネットワーク図化し視覚的に類似度を比較する過程および結果を述べる。 その際、重要度を考慮する場合としない場合で類似度計算を行い、どのような結果が現れるかを調べる。 本研究の調査対象のシラバスは本校電気情報工学科の専門科目とし、 実験を簡単にするため「応用数学A」のような一般科目は省略した。 実験の手順としては以下のようになる。

  1. Xpdfによるシラバスのテキスト化
  2. MeCabによる形態素解析とN-gram解析
  3. N-gram解析結果からネットワーク図の作成
  4. ネットワーク図による視覚的な類似度を比較

なお、今回の実験すべてR上で行った。 Rはベクトル処理を基本とするプログラミング言語であり、統計解析を始めとする計算処理に非常に強い。 また、多くの関数が用意されており、複雑な計算も少ない命令で実行してくれるという特徴がある。 この言語はオークランド大学のR. Ihaka氏とR. Gentleman 氏により作られ、オープンソースかつフリーのソフトウェアである。 また、RMeCabというMeCabのモジュールがあり、R上でMeCabを呼び出して使うことができる。 これを使うことで、より簡単にテキストマイニングが可能となる。



Subsections

Deguchi Lab. 2013年2月28日