Next:
cos類似度
Up:
R言語
Previous:
R言語
目次
TfIdf
パッケージRMeCabに含まれるdocMatrix関数を使用することにより、引数にTfとフォルダのディレクトリを指定すれば、フォルダ内のファイルを読み込み、式(
3.13
)の形でTfを計算することができるようになる。また、TfIdfを引数で指定することもできるが、Idfに1を足す方法となっている。このため、Idfを別で計算し、TfにかけることによりTfIdfを求めた。
Deguchi Lab.
2017年3月6日