next up previous contents
Next: モード法 Up: 実験に関する手法 Previous: ベクトル空間法   目次


2値化処理 [9]

2値化というのは画像処理の分野で良く耳にする言葉であるが、そこでは各画素の濃淡を一定の基準値によって黒と白の2つの値に変換する処理のことを指す。この基準値のことをしきい値(threshold value)と呼ぶ。本研究では3.3 項で述べたベクトル空間法を用いるが、これによって得られる結果は2つのベクトルの成す角度であるので、その値は最小値$-1$から最大値$1$までの間に分布することになる。なお用語・文書ベクトルにおいてはその成分に負が無く、この場合最小値$0$から最大値$1$に分布する。ここで例えば類似度を計算した結果が$0.6$であった時、これでは似ているか似ていないかがはっきりしない。そこで計算結果に2値化処理を適用することで、似ているか否かというの2つの状態に分けることにする。しきい値処理の種類としてはPタイル法やモード法、判別分析法、微分ヒストグラム法、動的しきい値法など様々なものが存在するが、今回使用したのはモード法であったので、それについて説明する。



Subsections

Deguchi Lab. 2011年3月4日