next up previous contents
Next: 実験2:日本語Wordnetを利用した類似度の計算 Up: 実験1:ベクトル空間法による類似度の計算 Previous: termmiを用いた類似度の計算   目次


実験1の結果

以上のような手順で実際に全科目のシラバスの類似度を調べた。 結果の述べ方としては3.2 節の通りで、3Eプログラミング、3E電気回路Iの結果を図3.1、図3.2にそれぞれ示す。 3E電気回路Iと3Eプログラミングは、3年生で学ぶ教科だが2年生で2E電気回路I、2Eプログラミングという科目があることに加え、4年生や5年生で4EE電気回路I Iや5E電気回路I I、4E数値計算、プログラミング言語論など上下の科目で類似科目が存在する。 そのため、類似度の結果について考察しやすい。 よって本論文ではこの2教科について特に注目して結果を述べていく。

図 3.1: ベクトル空間法による3Eプログラミングの結果
図 3.2: ベクトル空間法による3E電気回路Iの結果
\includegraphics[scale=0.45]{figure/3Eprog1.eps} \includegraphics[scale=0.45]{figure/3Edenki1-1.eps}

3Eプログラミングはプログラム系(J1)に、3E電気回路Iは電気回路系(E1)にそれぞれ属しており、この図を見ればわかる通り類似度はプログラム系、電気回路系が1番高くなっていることがわかる。 このような、科目が所属するグループの類似度が圧倒的に1番高くなったという結果は全ての科目において得られた。

これは、ベクトル空間法のみだと、その科目自身の類似度1.0が他の科目の類似度と比べて高くなりすぎている、という結果であると考えられる。 実際、3E電気回路Iの類似度の結果を見てみると、類似度1位から「3E電気回路I 1.000」、「5E電気回路I I 0.104」、「4EE電気回路I I 0.097」、「2E電気回路I 0.087」、「4EE情報伝送工学 0.059」と電気回路系の科目ばかりが続くが類似度は非常に低くなっている。 もともとベクトル空間法は重要語がマッチすれば重要度が足されるという計算なので、例えば意味が似ているような「プログラム」と「プログラミング」でも全く違う単語とされてしまう。 やはり意味を考慮する必要があると思われる。



Deguchi Lab. 2012年3月12日