複合名詞の重要度の計算には二つの考え方がある。 第一の考え方は、複合名詞の重要度はその構成単名詞数、すなわち長さに依存するというものである。 この考え方に従えば、長い複合名詞ほど高い重要度がつくことが自然である。 第二の考え方は、重要度は複合名詞の長さに依存しないというものである。この考え方に従えば、 長さに対して依存しないような正規化が必要になる。 専門用語に複合名詞が多いことは認めるにしても、長い程、あるいは短い程、重要であるという根拠は 今のところない。 よって、第二の考え方を進めていくことにする。
まず、単名詞
がこの順で連接した複合名詞を
とする。
の重要度として
各単名詞の重要度の平均をとれば、第二の考えに沿った
の長さに依存しない重要度を定義できる。
平均として、ここでは相加平均ではなく相乗平均を採用する。
ただし、
の構成要素の単名詞の重要度が一つでも0になると
の重要度が0になってしまうのを避けるために次式で
の重要度
を定義する。