next up previous contents
Next: ベクトル空間法による類似度を計算 Up: データ整理 Previous: シラバスと用語の行列生成   目次

主成分数の導出と近似行列の生成

5.1.3節で実験に必要なデータが整ったので、次はこれを用いてLSAを行い、主成分数を求めた。 主成分数の求め方には3.3.1項にいくつか示したが、どの方法が良いかは判別しがたく、 2は他の方法よりも基準が曖昧であることから1と3を利用することにした。

1では固有値が必要となるので、これは主成分分析を行う関数prcompにより求めた。 引数としてはCSVファイルに記述した表5.3を与え、返り値として固有値・固有ベクトル・平均値・標準偏差・主成分得点を得る。

3では累積寄与率が必要となるので、prcompを適用した後にsummaryという関数を用いてこれを求めた。 返り値はリスト型の標準偏差・寄与率・累積寄与率であり、この累積寄与率が80%を越える主成分までを用いることにした。

主成分数が決定したら、svd関数により特異値分解を行い、特異値分解によって得られた左特異ベクトルの主成分数まで取り出したものを転置したものと、元の行列を掛け合わせることで行列の縮約が行える。



Deguchi Lab. 2013年2月28日