Next: 実験結果
Up: LSAによる類似度計算
Previous: ベクトル空間法による類似度を計算
目次
5.2項により求められた文書の類似度の結果を評価する。
本研究室においては、以前にシラバスの類似度を評価する際に以下のような評価方法を用いている。
- i.
- 比較回数, 教科番号, シラバス数, 抽出教科数とする。
- ii.
- とする。
- iii.
- ある教科を選択し、に対して類似度が番目に高かった教科を抽出する。
- iv.
- の類似度が0であれば vii に進み、そうでなければ v に進む。
- v.
- 科目構成図においてとを結び、その距離を求めてに1を足す。
- vi.
- なら vii に進み、そうでないならに1を足して iii に戻る。
- vii.
- なら viii に進み、そうでないならに1を足して ii に戻る。
- viii.
- 得点を計算する。
上記の得点は以下の式によって計算される。
|
|
|
(5.1) |
ここでは目標距離であり、とがどれだけ離れていれば望ましいかを表す。実験ではこの値を2としたので、
が1でが100に近ければ、多くの教科が一番似ているとされる教科と科目構成図において2つほどしか離れておらず、
適切な類似度が求められていることが分かる。
この評価方法は結果が数値として出るが、グラフにしても類似度がわかりにくいので、
本研究ではベクトル空間法で求めた類似度をさらに3.6項で述べた多次元尺度法を文書間の距離関係に変換し、2次元に視覚化する。
これにより文書の類似度が一目で分かるようになる。
Deguchi Lab.
2013年2月28日