next up previous contents
Next: 実験結果 Up: LSAによる類似度計算 Previous: ベクトル空間法による類似度を計算   目次

多次元尺度法による視覚的な類似度評価

5.2項により求められた文書の類似度の結果を評価する。 本研究室においては、以前にシラバスの類似度を評価する際に以下のような評価方法を用いている。

i.
比較回数$c=0$, 教科番号$i=1$, シラバス数$M$, 抽出教科数$N$とする。
ii.
$j=1$とする。
iii.
ある教科$A_i$を選択し、$A_i$に対して類似度が$j$番目に高かった教科$B_{ij}$を抽出する。
iv.
$B_{ij}$の類似度が0であれば vii に進み、そうでなければ v に進む。
v.
科目構成図において$A_i$$B_{ij}$を結び、その距離$d_{ij}$を求めて$c$に1を足す。
vi.
$j==N$なら vii に進み、そうでないなら$j$に1を足して iii に戻る。
vii.
$i==M$なら viii に進み、そうでないなら$i$に1を足して ii に戻る。
viii.
得点$S$を計算する。
上記の得点$S$は以下の式によって計算される。


$\displaystyle S=\frac{Gc}{\sum^M_{i=1}\sum^N_{i=1}d_{ij}}\times100$     (5.1)

ここで$G$は目標距離であり、$A$$B$がどれだけ離れていれば望ましいかを表す。実験ではこの値を2としたので、 $N$が1で$S$が100に近ければ、多くの教科が一番似ているとされる教科と科目構成図において2つほどしか離れておらず、 適切な類似度が求められていることが分かる。

この評価方法は結果が数値として出るが、グラフにしても類似度がわかりにくいので、 本研究ではベクトル空間法で求めた類似度をさらに3.6項で述べた多次元尺度法を文書間の距離関係に変換し、2次元に視覚化する。 これにより文書の類似度が一目で分かるようになる。



Deguchi Lab. 2013年2月28日