クラスター分析

R言語でhclust関数にTfIdfのcos類似度の行列を入力とし、引数methodには``ward.D2''を指定しクラスター分析を行い、plot関数にhclust関数の結果を入力することで樹形図を書き出した。ウォード法を使用した理由として、ウォード法の結果はバランスがとれた分類がされやすいからである。結果の樹形図をFigure 4.1に示す。

図 4.1: Calculation of similarity by cos similarity
\includegraphics[width=14cm]{Rplottcw.eps.eps}



Deguchi Lab. 2017年3月6日