next up previous contents
Next: 結論 Up: シラバス特有の語の除去 Previous: 除去後の重要語およびその重要度   目次

除去後の類似度

除去後のシラバスの類似度を計算した結果をグラフにしたものを図 5.1、図 5.2に示す。 図 4.1や図 4.2と比べると、それぞれ電気系の科目は電気系の科目が、 情報系の科目は情報系の科目の類似度が比較的高くなっていることがわかる。 これより、シラバス特有の単語を除去することでその科目の特徴が顕著に現れ、 その結果が類似度にも現れていると言える。


  • 除去後の3E電気回路Iの重要語およびその重要度
  • 除去後の3Eプログラミングの重要語およびその重要度
  • 表 5.2: 除去後の3E電気回路Iの重要語およびその重要度
     
    重要語 重要度
    波交流 68.17
    過渡現象 41.03
    電力 37.95
    交流電力 14.00
    例題 7.00
    最大電力供給 6.84
    単相電力 6.72
    直流過渡現象 6.60
    力率 6.34
    6.00
    RLC回路 5.42
    5.00
    正弦波交流 4.85
    フーリエ級数展開 4.53
    回路 4.24
    電流 4.00
    4.00
    電圧 4.00
    表 5.3: 除去後の3Eプログラミングの重要語およびその重要度
    重要語 重要度
    C言語 15.87
    連結リスト 12.25
    木構造 9.36
    高速ソート法 9.26
    演習 9.00
    プログラム 8.49
    ソート 6.00
    6.00
    文字列 6.00
    単純ソート法 5.88
    プログラミング 5.00
    リスト 4.90
    サーチ 4.24
    データ 4.00

    図 5.1: 3E電気回路Iの結果(シラバス特有の単語除去後)
    \includegraphics{a3Edenki.ps}
    図 5.2: 3Eプログラミングの結果(シラバス特有の単語除去後)
    \includegraphics{a3Eprog.ps}

    これらの図ではシラバス特有の単語除去前後で、全体がどのように変化したのかわかりにくい。 確かに、類似度が1番目から5番目までの高い教科は電気系、情報系と分かれたが、 全体的にどのような科目は類似度が減少し、どのような科目は類似度が減少していないかが、これらの図ではわからない。 そのため、まず教科をそれぞれ8つのグループにわけた。 8つのグループは

    とした。 各教科のグループ分類表を表 5.4に示す。 そしてそのグループごとに除去前後の類似度をそれぞれ足し合わせ、 除去前の合計値と除去後の合計値の差を取って正規化し、 グラフにすることで除去前後の類似度の減少率を見れるようにした。 数式化すると以下のようになる。

    グループ $ G_i(i=1,2,...8)$ に属する教科を $ S_{ij}(j=1,2,...,m_i)$ とする。 (ただし $ G_1=$E1 , $ G_2=$E2 , ..., $ G_8=$T であり、 $ S_{ij}$ はグループ $ i$ の各教科に対応しており、$ m_i$ はグループ $ G_i$ に属する教科数とする) このとき、あるグループ $ G_a$ に属する、ある教科 $ S_{ab}$ のグループ $ G_i$ への類似度を $ Gsim(S_{ab},G_i)$ とすると、 $ Gsim(S_{ab},G_i)$ は式(5.1)で表される。

    $\displaystyle Gsim(S_{ab},G_i)= \left \{ \begin{array}{lc} \dfrac{\displaystyle...
...}{sim(S_{ab},S_{aj})-sim(S_{ab},S_{ab})}}{m_a-1} & (i = a) \end{array} \right .$ (5.1)

    この $ Gsim(S_{ab},G_i)$ を、シラバス特有の語除去前後でそれぞれ計算し割合を出したものが減少率である。 式(5.1)では、減少率をより正確に表すために、$ i=a$ のときの求めたい教科それ自身との類似度は含まないようにしている。 減少率は式(5.2)で求められる。

    減少率$\displaystyle =\frac{\mbox{除去前の}Gsim-\mbox{除去後の}Gsim}{\mbox{除去前の}Gsim}$ (5.2)

    式(5.1)、式(5.2)を利用して、各教科の減少率を調べた。 「3E電気回路I」、「3Eプログラミング」の結果をそれぞれ図 5.3、図 5.4に示す。

    表 5.4: グループの分類
    \scalebox{0.7}{
\begin{tabular}{\vert c\vert lll\vert}
\hline
\multirow{4}{7z...
...験 & 5EJ情報工学実験 \\
& 5E卒業研究 & & \\ \hline
\end{tabular} }


    図 5.4からもわかるように 「3Eプログラミング」はプログラム系(J1)に属しており、 そのグループの類似度の減少率は低く、他のグループは高い。 すなわち、シラバス特有の単語の除去前後で類似している科目に関してはあまり類似度が下がらず、 類似していない科目に関しては類似度が大きく下がっていることから、 シラバス特有の単語を除去することで類似度がより顕著に現れていると言える。

    だが、図 5.3を見ると図 5.4に比べ減少率にあまり差が出ていない。 「3E電気回路I」は「電気回路系(J1)」に属しているが、減少率は約0.55ほどで、 同じグループに属している教科に関しても類似度が大きく下がってしまった。 これは「電気回路系(J1)」の科目が様々なことを学習していることから、 シラバスにおいても多様な重要語が現れ、類似度があまり高くならないからと考えられる。

    図 5.3: 3E電気回路Iの除去前後の減少率
    \includegraphics[scale=0.5]{3Edenki.eps}
    図 5.4: 3Eプログラミングの除去前後の減少率
    \includegraphics[scale=0.5]{3Eprog.eps}


    next up previous contents
    Next: 結論 Up: シラバス特有の語の除去 Previous: 除去後の重要語およびその重要度   目次
    Deguchi Lab. 2010年3月5日