Next: LSAについて
Up: データ整理
Previous: データ整理
目次
シラバスと用語の行列生成
TermExtractを用いる際には複合語が生成されることになるが、以前の研究結果[16]より、シラバスの類似度を計算するのに有効でないことが分かった。例えば「リアクタンス二端子網」というような複合語があった時、これは「リアクタンス」にも「二端子網」にも一致しないことになる。このような専門的過ぎる語句は他の教科に存在せず、類似度の上昇に影響を与えないものになると考えられる。その一方で「変圧器」のように「変圧」と「器」を合成して一般的な語にするはたらきもある為、複合語を作るか作らないかは一長一短であると言える。本研究では今年度より追加されたルーブリックが及ぼす影響を調べる為にも、そのどちらが良いかを調べる為にも、複合語を生成した場合としなかった場合の2つのデータを用意することにした。
Deguchi Lab.
2016年3月4日