解説/アルゴリズム
データ x1,x2...,xn の平均を μ としたとき、各数値 xi と平均 μ の差、すなわち、 xi−μ を、 xi の偏差
と呼ぶ。
偏差自体は平均値からの相対距離なので、平均からどれだけ離れてデータが散らばっているかというのを値で確認できる。ただし、個々の値の指標としては偏差は役に立つのだが、たとえば偏差の平均を求めようとすると厄介なことになる。
偏差の平均
偏差の合計の式は、
(x1−μ)+(x2−μ)+...+(xn−μ)
となり、 xi を前に持っていき、 μ は n 個あるわけだから、
(x1+x2+...xn)−nμ
と変形できる。
ここで平均値を求める式を見てみる。
μ=nx1+x2+...+xn
両辺に n を掛けると、
nμ=x1+x2+...+xn
nμ と各値の合計が等しいことがわかる。
(x1+x2+...xn)−nμ=0
つまり、偏差の合計はかならず 0 になることがわかる。
(x1−μ)+(x2−μ)+...+(xn−μ)=(x1+x2+...xn)−nμ=0
偏差の平均が 0 になるのでデータの散らばり度合いを確認することができない。
代わりに偏差の計算を発展させた分散や標準偏差などが使用される。