R言語

R言語は統計解析向けのプログラミング言語及びその開発実行環境である。多くの関数が用意されているため、複雑な計算を数行で実行できるという特徴がある。また、オープンソースかつフリーのソフトウェアである。R言語はS言語を参考としてニュージーランドのオークランド大学のRoss IhakaとRobert Clifford Gentlemanにより作成された。S言語は行列を扱うことができるので、R言語も行列を扱うことができる。この実験では、式(3.13)のような、行列を主に使用するのでこのR言語を主に使用することとした。

R言語では、TfIdf、cos類似度、主成分分析、LSI、クラスター分析はそれぞれ関数が用意されているので非常に簡単に実行することができる。以下にそれぞれの関数について書く。


Subsections

Deguchi Lab. 2017年3月6日