形態素解析[1]

形態素とは、意味の最小の単位である。形態素解析は、テキストを形態素に分解することである。 具体的には、文書を品詞単位に分けることで、それぞれの単語の頻度を計算に使用することである。 日本語は英語などのように、分かち書きとよばれる単語の区切りに空白を開ける記述をしない。単語が空白で区切られていないというのは、形態素解析をしづらくしている。 形態素解析のツールは幾つかあるが、この研究では、MeCabというソフトを使用した。

Deguchi Lab. 2017年3月6日