next up previous contents
Next: 実験結果 Up: 実験3 : PLSAを用いた類似度計算 Previous: データ準備   目次


ベクトル空間法の実行と2値化処理

Rを用いてPLSAを実行し、最終的に得られる$P(d \, \vert \,z)$に対してベクトル空間法を適用することで各教科の類似度を算出した。また、実験1と実験2と同様に類似度の差が0.1以上あった時に2値化を行うことにした。参考に、このソースコードを付録に添付しておく。

PLSAは設定するパラメータが多く、何が適切なのかが分からなかった為に、隠れ変数$z$の数はLSAにおける主成分数と同じ16個とし、初期値には一様分布に従う乱数を用いることにした。また、$\beta$を変更させる係数$\eta$は0.95、反復回数は40回として計算させることにした。この条件でプログラムを実行した結果(2値化無)の一例を表 6.1に示す。この表を見ると、表 4.3や表 5.5と比べて、大分変わった結果であることが分かる。ここでは、評価対象は5E画像処理工学のみとなる。


表 6.1: ベクトル空間法の実行結果の上位一部
教科名 4E数値計算に対する類似度
4E数値計算 1.000000
5E画像処理工学 0.999896
4E信号処理 0.230636
4E電気情報工学実験 0.143223
2Eディジタル回路I 0.092059
5Eコンパイラ 0.081158
5E電子計測 0.069144
4EJ情報工学実験 0.047302
4E工学基礎研究 0.033539
5E卒業研究 0.023624
2Eプログラミング 0.015399



Deguchi Lab. 2011年3月4日