next up previous contents
Next: 尖度 Up: 統計量 Previous: 統計量   目次

平均、分散、標準偏差[12]

いくつかのデータがあるとき、その平均は同じでも分布の様子が異なっている場合がある。 データの広がりを表す数値を散布度という。 最も簡単な散布度は、最大値と最小値の差である。 これを範囲(レンジ)といい、Rで表す。 範囲は簡単に求められるという利点を持つが最大値と最小値のみに依存するため、 それ以外のデータのちりばり具合を表していない。 そこで、それ以外のすべてのデータを用いた散布度を定義する。 それにはデータの平均に着目して、データ全体として平均からどの程度広がっているか見ればよい。 いま、変量$x$のデータを $ x_ {i}$ $i = 1, 2, \ldots , n$ )とするとき、 各々のデータ $ x_ {i}$ と平均 $\mu$ との隔たり(これを偏差という)は$ x_ {i}-\mu$で表される。 散布度の定義として、まず偏差の絶対値の平均$\vert x_ {i}-\mu\vert$の平均
\begin{displaymath}
d =
\frac{\vert x_1-\mu\vert+\vert x_2-\mu\vert+\cdots \vert x_n-\mu\vert}{n}
\end{displaymath} (5.3)

が考えられる。この散布度$d$を平均偏差という。しかし、絶対値は一般に取り扱いにくいため、偏差を2乗したものの平均
\begin{displaymath}
v_x =
\frac{(x_1-\mu)^2+(x_2-\mu)^2+\cdots (x_n-\mu)^2}{n}
=\frac{1}{n} \sum_{i=1}^n(x_i-\mu)^2
\end{displaymath} (5.4)

によって散布度を定めることにする。$v_x$をデータの分散という。また、分散$v_x$の正の平方根をとったものをデータの標準偏差といい。$s_x$で表す。
\begin{displaymath}
s_x =
\sqrt{v_x} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i-\mu)^2}
\end{displaymath} (5.5)



Deguchi Lab. 2013年2月28日