next up previous contents
Next: 実験結果 Up: 実験2 : LSAを用いた類似度計算 Previous: 主成分数の導出と近似行列の生成   目次


ベクトル空間法の実行と2値化処理

実験1では用語ベクトルに対してベクトル空間法を実行したが、ここでは5.1.4 節で作成した近似行列に対して行った。その後、実験1と同様に類似度に0.1以上の差があればモード法によって2値化を行うことにした。参考として、ここまで用いたRのプログラムのソースコードを付録に添付しておく。プログラムはコマンドライン上から実行することを想定しており、2値化の有無と主成分数を採用するパターンを設定出来るようになっている。

今回ベクトル空間法を行った結果を表 5.5に示す。この表は複合語無・重要度有時の4E数値計算の類似度計算結果であり、ここでは4EJデータ構造とアルゴリズムと5Eコンパイラの類似度差が0.1を越えているので、3Eプログラミング、2Eプログラミング、4EJデータ構造とアルゴリズムが評価対象となる。類似度の大きさは実験1とは大分異なっており、表 4.3と合わせて見ればそれがよく分かる。ここでの主成分数の取り方は、固有値が1を越えるものを採用した。


表 5.5: ベクトル空間法の実行結果の上位一部
教科名 4E数値計算に対する類似度
4E数値計算 1.000000
3Eプログラミング 0.902044
2Eプログラミング 0.895695
4EJデータ構造とアルゴリズム 0.873805
5Eコンパイラ 0.747484
5Eプログラミング言語論 0.654616
5E電磁エレクトロニクス 0.616298
5EJ電磁波工学 0.557497
4EJ情報数学 0.536467
4EJ言語理論 0.500502



Deguchi Lab. 2011年3月4日