next up previous contents
Next: 参考文献 Up: osaki Previous: 実験結果   目次

結論

本研究では平成27年度から導入されたルーブリックを含む岐阜工業高等専門学校電気情報工学科・Jコースのシラバスを用いて、テキストマイニングにより各教科の類似度を求めた。 類似度の計算方法としては、最初にシラバスに含まれる単語を抽出し、他のシラバスとの単語の完全一致を用いて計算する手法を用いた。このときに単語として複合語を用いたら計算の精度がどうなるか、シラバスに含まれる単語の重要度を考慮したらどうなるかを調べるために、これらの条件を変更して実験を行い、その後2値化処理をせずに同じ実験を行った。 結果としては、類似度計算のスコアを計算する際に抽出教科数を小さくすると複合語有効・重要度無効のデータが、抽出教科数を大きくすると重要度有効のデータ、特に複合語無効・重要度有効のデータのスコアが高くなっていることが分かった。 抽出教科数の大きい時に複合語無効・重要度有効のデータのスコアが高くなるのは以前のLSAに対する研究結果と同じ結果であるが、今回の実験では複合語有効・重要度無効のデータが高いスコアの時があった。この結果はすなわち、複合語を有効かつ重要度を無効にすると一番似ている教科を求めるにはよい、ということを示している。 これは、シラバスにルーブリックが追加されたことでその科目のキーとなる複合語が現れやすくなったことに加え、ルーブリック内に科目とは直接関係のない単語が頻出するため、重要度の計算があまり意味のないものになっているのではないかと考えられる。 また、2値化処理していない時と2値化処理時の実験結果を比べると、2値化処理時の複合語無効・重要度無効の結果が改善されていることが分かる。これは複合語無効・重要度無効で類似度を計算すると、あまり似ていない科目をうまく計算できなかったため、2値化処理をして切り捨てることでスコアが上がったのではないかと考えられる。

次にLSAを用いて類似度を求めることにした。ここでも実験1と同じように複合語・重要度、2値化処理の有無を変更し8パターンの実験を行った。この結果は前年度と同じく複合語無効・重要度有効の結果が最もスコアが高くなった。また、2値化処理をしていない時の結果と2値化処理時の結果を比較しても大きな差はなく、類似度の高くない科目もうまく計算できていると言える。

本研究ではベクトル空間法を用いて類似度を計算した際のスコアの平均が約32.2、LSAを用いて計算した際のスコアの平均が約31.6であったのに対し、以前の研究[16]では、ベクトル空間法を用いて類似度を計算した際のスコアの平均が約39.2、LSAを用いて計算した際のスコアの平均が約37.5と、低くなっていることが分かる。これは前述した通り、ルーブリックが追加されたことによって科目に直接関係ない、「正確」「問題」といった単語が多く現れたことや、そういった単語が頻出したことによって意味の薄い単語の重要度が上がってしまい、関連度の低い教科同士が似ていると判断されたのではないかと考えられる。

今回の研究では、ルーブリックに頻出する単語や意味が似ている語を考慮した単語の重み付けができていないため、このような問題を解消するために単語の重み付け方法などの改善をしなければならない。

謝辞
最後に本研究を進めるにあたり、御多忙中にもかかわらず多大な御指導を賜わりました出口利憲先生に深く感謝するとともに、 同研究室において共に勉学に励んだ坂井菜月氏、山田万太郎氏に厚くお礼を申し上げます。



Deguchi Lab. 2016年3月4日