LSI

R言語で3.2.4節で説明した通りに求めた。svd関数にTfIdfを入力することで、左特異(ターム)ベクトル、特異値、右特異(文書)ベクトルが得られるので、左特異ベクトルの31列目までの転置行列とTfIdf行列を掛け合わせ、31次元の要素と文書による行列を作成した。もともと58個の文書があったので27次元の圧縮が出来た。

Deguchi Lab. 2017年3月6日