next up previous contents
Next: 実験2:LSAを用いた類似度計算 Up: 実験1:ベクトル空間法を用いた類似度計算 Previous: ベクトル空間法の実行と2値化処理   目次


実験結果

結果を評価する基準として、岐阜工業高等専門学校のホームページに掲載されている教育課程表と科目構成図[14]をグラフに見立てて用いた。その評価方法は以下に示す通りである。

比較回数$ c = 0$ , 教科番号$ i = 1$ , シラバス数$ M$ , 抽出教科数$ N$ とする。 $ j = 1$ とする。 ある教科$ A_{i}$ を選択し、$ A_{i}$ に対して類似度が$ j$ 番目に高かった教科$ B_{ij}$ を抽出する。 $ B_{ij}$ の類似度が0であれば vii に進み、そうでなければ v に進む。 科目構成図において$ A_{i}$ $ B_{ij}$ を結び、その距離$ d_{ij}$ を求めて$ c$ に1を足す。 $ j == N$ なら vii に進み、そうでないなら$ j$ に1を足して iii に戻る。 $ i == M$ なら viii に進み、そうでないなら$ i$ に1を足して ii に戻る。 得点$ S$ を計算する。

上記の得点$ S$ は以下の式によって計算される。

$\displaystyle S = \frac {G   c} {\sum^M_{i=1} \sum^N_{j=1} d_{ij}} \times 100$ (4.1)

ここで$ G$ は目標距離であり、$ A$ $ B$ がどれだけ離れていれば望ましいかを表す。実験ではこの値を2としたので、$ N$ が1で$ S$ が100に近ければ、多くの教科が一番似ているとされる教科と科目構成図において2つほどしか離れておらず、適切な類似度が求められていることが分かる。

この$ S$ を用いて、複合語と重要度の有無をそれぞれ切り替えた4つのデータを2値化処理をせずに比較した結果を表4.6に、また、グラフ化したものを図4.1に示す。


表 4.6: 複合語と重要度の有無によるスコア変化
抽出
教科数
複合語有 複合語無
重要度無 重要度有 重要度無 重要度有
1 35.80 32.95 31.61 32.22
2 32.04 31.65 30.37 31.14
3 31.78 31.84 30.82 31.58
4 32.24 33.17 30.83 31.72
5 31.90 32.28 30.77 32.33

図 4.1: 複合語と重要度の有無によるスコアの変化
\includegraphics[scale = 1.0]{dtmno.eps}

また、4つのデータを2値化処理をした後に比較した結果を表4.7に、グラフ化したものを図4.2に示す。


表 4.7: 複合語と重要度の有無による2値化処理時の得点の変化
抽出
教科数
複合語有 複合語無
重要度無 重要度有 重要度無 重要度有
1 35.80 32.22 31.61 32.95
2 32.08 31.37 31.69 31.17
3 32.34 30.68 31.80 32.41
4 32.79 32.09 31.69 33.61
5 32.78 32.95 32.04 33.16

図 4.2: 複合語と重要度の有無による2値化処理時のスコアの変化
\includegraphics[scale = 1.0]{dtm.eps}

実験結果を見ると、各スコアの値は30から36の間の値を取っていることが分かる。

未2値化処理時の結果は表4.6より、複合語に着目すると抽出教科数が多い時、複合語が有効の結果よりも、複合語無効の結果の方がスコアが高くなっていることがわかる。 重要度に着目すると、抽出教科数が多くなるにつれて、重要度を考慮したものの方が結果が良くなっていることが分かる。このことより、多くの比較対象がある時、重要度を考慮した方がよりよい結果が得られると考えられる。また、抽出教科数が少ない時、複合語あり・重要度なしで計算した時の結果が、他のものと比べて良くなっていることがわかる。

2値化処理時の結果は表4.7のようになった。2値化処理をしていない時の結果と比較すると、複合語無し・重要度無しのスコアが未2値化処理時よりも全体的に高くなっていることがわかる。 複合語無し・重要度無しの結果を見ると、他の結果に比べ変化が小さく、スコアも低いことがわかる.


next up previous contents
Next: 実験2:LSAを用いた類似度計算 Up: 実験1:ベクトル空間法を用いた類似度計算 Previous: ベクトル空間法の実行と2値化処理   目次
Deguchi Lab. 2016年3月4日