next up previous contents
Next: LSAについて Up: データ整理 Previous: データ整理   目次


シラバスと用語の行列生成

TermExtractを用いる際には複合語が生成されることになるが、以前の研究結果[16]より、シラバスの類似度を計算するのに有効でないことが分かった。例えば「リアクタンス二端子網」というような複合語があった時、これは「リアクタンス」にも「二端子網」にも一致しないことになる。このような専門的過ぎる語句は他の教科に存在せず、類似度の上昇に影響を与えないものになると考えられる。その一方で「変圧器」のように「変圧」と「器」を合成して一般的な語にするはたらきもある為、複合語を作るか作らないかは一長一短であると言える。本研究では今年度より追加されたルーブリックが及ぼす影響を調べる為にも、そのどちらが良いかを調べる為にも、複合語を生成した場合としなかった場合の2つのデータを用意することにした。


表 5.1: LSAで取り込むデータ行列
\scalebox{1.0}{
\begin {tabular}{\vert c\vert c\vert c\vert c\vert c\vert}
\hl...
...dots$ & 0 \ \hline
高遠& 0 & 0 & $\cdots$ & 0 \ \hline
\end {tabular}
}




Deguchi Lab. 2016年3月4日