Next: termmiを用いた類似度の計算
Up: 実験1:ベクトル空間法による類似度の計算
Previous: TermExtractを用いて重要語の抽出および重要度を計算
目次
シラバスには例えば「前期」や「授業」といった明らかに専門用語ではないシラバス特有の語が多く含まれる。
今回、文書ファイルとしてシラバスを扱うが、そういった語を含めると確かに「シラバス」という共通点で全て類似している。
しかし、今回はシラバスにおいての類似度であり、類似度をより顕著に出すためにもそれらの語、またはそれらの語を含む複合語を除く必要がある。
対象の語は以下の通りである。
表 3.2:
シラバス特有な語として除いた語
・岐阜工業高等専門学校 |
・電気情報工学科 |
・教科 |
・担当 |
・教員 |
・学年 |
・学科 |
・開講時間 |
・学習 |
・教育 |
・授業 |
・成績 |
・評価 |
・達成度 |
・基準 |
・教科 |
・参考 |
・概要 |
・前期 |
・後期 |
・中間 |
・期末 |
・試験 |
・JABEE |
・必修 |
・通年 |
|
|
Deguchi Lab.
2012年3月12日