next up previous contents
Next: 結論 Up: 実験2:LSAを用いた類似度計算 Previous: ベクトル空間法の実行と2値化処理   目次


実験結果

LSAでも、先ほどと同じように、シラバスのテキストファイルに前処理を行ったものと編集を行っていないものの重要度と複合語の有無による得点を調べた。結果を評価する基準は前章と同じである。この基準を用いて得点を算出した結果を表5.3と表5.4に示す。また、これをグラフ化したものを図5.1と図5.2に示す。前者はLSAによるシラバスに前処理を加えていないものの結果であり、この時の主成分数は複合語無・重要度有時では固有値が1を越えるものを採用し、それ以外では累積寄与率が80%を越えるまでのものを採用することにした。後者はシラバスのテキストファイルに前処理を加えたもののLSAによる類似度計算を前者の条件を一緒にして行った結果である。



表 5.3: 前処理無のシラバスの重要度と複合語の有無による得点の変化
  複合語無 複合語有
  重要度無 重要度有 重要度無
1 37.79 37.54 35.80
2 35.64 37.24 35.69 34.32
3 35.47 36.90 36.67 35.55
4 35.42 37.83 36.39 35.86
5 35.54 38.21 36.20 37.44

図 5.1: 前処理無のシラバスの重要度と複合語の有無による得点の変化
\includegraphics[scale=0.95]{fig04.eps}


表 5.4: 前処理有のシラバスの重要度と複合語の有無による得点の変化
  複合語無 複合語有
  重要度無 重要度有 重要度無
1 38.96 38.35 40.80
2 38.27 38.20 37.99 36.96
3 38.01 40.05 38.54 38.11
4 37.16 39.80 38.27 37.71
5 36.77 39.84 38.06 38.49

図 5.2: 前処理有のシラバスの重要度と複合語の有無による得点の変化
\includegraphics[scale=0.95]{fig05.eps}

表 5.3より、前処理を加えていないシラバスでは、複合語を無効にしたときの重要度は有効にすると得点が全体的に上がっていることが分かる。これは複合語を無効にした時は、重要度を考慮すると良いことが言える。複合語を有効にしたときは、得点が上がったり下がったりしていてあまり重要度をあまり考慮する必要がないと言える。今度は、見方を変えて複合語の有無で結果を見てみると、重要度を考慮していない時は、複合語を有効にすると得点は上がっていることが分かる。反対に重要度を考慮すると、複合語を有効にした方が得点は下がっていることが分かる。そして、全体の得点から重要度を有効にして、複合語を無効にした時が一番得点が高くなっている。つまり、この結果から言えることは、重要度を有効にし複合語は無効にしてやると、理想の結果に一番近いものが得られることが言える。これは、昨年度の結果[14]と同じであった。

表 5.4より、前処理を加えたシラバスでも同じように、重要度を有効にして、複合語を無効にした時が平均的にみて、得点が高いことが分かる。複合語の有無では、複合語を有効にして抽出教科数が1つの場合は、全体で一番高い得点であった。しかし、教科数を増やしていくと点数は下がっていった。そして、2つの表を見比べてみて、シラバスに前処理を行った方が全体的に高い得点率になっている。これは、前章でも述べたようなことが影響していると考えられる。


next up previous contents
Next: 結論 Up: 実験2:LSAを用いた類似度計算 Previous: ベクトル空間法の実行と2値化処理   目次
Deguchi Lab. 2012年3月9日