結論

本研究では岐阜工業高等専門学校電気情報工学科情報専攻の58科目のシラバスを用いて、テキストマイニングにより各教科の類似度を求めた。その方法として、まず既存の技術であるcos類似度計算法を用いてクラスター分析を行う方法と、LSIを用いてクラスター分析を行う方法でシラバスの類似度を計算し、樹形図に示した。その結果、科目をいくつかのグループに分けられることが分かり、次の実験の基準とするために9つのグループを作成した。

次の実験では、日本語WordNetを用いることで名詞間の概念距離を計算できることを利用し、新しい類似度計算の方法を試した。しかし、概念距離を使用した類似度計算には、いくつかの手段を選ぶことができ、最良の結果を得る手段は分からなかった。そこで6つの結果を求め、最良の方法を考察した。

その結果、ウォード法とcos類似度を選択した結果が最も良く類似度を求められていることがわかった。しかし、最もよいと判断した方法でも、基準とした方法のようにはグループごとに分類できていいなかった。

また、クラスター分析を用いた類似度計算には、日本語WordNetの辞書登録の問題と実験方法に改善の余地がありそうだということが分かった。



Deguchi Lab. 2017年3月6日