next up previous contents
Next: 実験3:LSAを使った類似度の計算 Up: 実験2:日本語Wordnetを利用した類似度の計算 Previous: 類似度の計算   目次

実験2の結果

以上のような手順で実際に全科目のシラバスの類似度調べた。 そのうち3Eプログラミング、3E電気回路Iの結果を図3.3、図3.4にそれぞれ示す。 結果の表示の方法は3.3.6 項で述べた通りである。

図 3.3: 日本語Wordnetを利用した類似度の計算による3Eプログラミングの結果
図 3.4: 日本語Wordnetを利用した類似度の計算による3E電気回路Iの結果
\includegraphics[scale=0.45]{figure/3Eprog2.eps} \includegraphics[scale=0.45]{figure/3Edenki1-2.eps}

3.1や図3.2と比べると全体的に類似度が大きくなっていることがわかる。 これは式(2.7)上、意味が似ている重要語の重要度も類似度の上昇につながるため、当然の結果である。 このような結果は、3Eプログラミングだけではなく全ての科目で同様の結果が得られた。 3Eプログラミングはプログラム系の科目でも基礎的な内容を扱うため、基礎科目がより専門的な科目を包含していると考えれば妥当であると言えなくもないが、関連度の計算結果を見てみると一般的な語の関連度が大きくなりすぎてしまったように感じられた。 また、その他情報系の類似度と電磁気系の類似度が同程度になってしまったが、3Eプログラミングのシラバスの内容を見ると、その他情報系の類似度がもっと高くても良いと考えられるし、電気磁気系の科目とは全く関係がないのでもっと低くても良いのではないかと考えられる。

さらに、3E電気回路Iでは実験1と比べ電気磁気系のグループの類似度が非常に大きくなり、3E電気回路Iが所属する電気回路系とほぼ同じ程度の類似度となった。 電気回路系の科目では、電気磁気系のグループの類似度が非常に大きくなった結果が多々見られ、2E電気回路Iや1E電気電子設計製図に至っては電気回路系よりも電気磁気系のグループの類似度のほうが高くなってしまった。 一方、電気回路系以外のグループでは、ほぼ全ての科目においてその科目が所属するグループの類似度が高くなっている。 これは、電気回路系の科目の重要度の大きい重要語である「交流回路」や「直流回路」などが、日本語Wordnetに登録されていないことが原因であると考えられる。 ただし、「交流」や「回路」といった言葉は日本語Wordnetに登録されているため、関連度を計算する際に複合名詞で計算するだけではなく、単名詞に分けて計算をすることで改善が期待できる。



Deguchi Lab. 2012年3月12日