解説/アルゴリズム
データ x1,x2...,xn の平均を μ 、各数値 xi と平均 μ の差、すなわち、 xi−μ を、 xi の偏差としたとき、各数値 xi の偏差をそれぞれ二乗した値の平均を分散
と呼ぶ。
分散をV
で表すとき、 V=n(x1−μ)2+(x2−μ)2+...+(xn−μ)2 になる。
式の変形
V=n(x1−μ)2+(x2−μ)2+...+(xn−μ)2
の右辺の分子を展開すると、
V=n(x12+x22+...+xn2)−2(x1+x2+...xn)μ+nμ2
平均値の式の変形である nμ=x1+x2+...xn を利用すると、
V=n(x12+x22+...+xn2)−2nμ2+nμ2
同類項をまとめて、
V=n(x12+x22+...+xn2)−nμ2
後ろの項 n−nμ2 を切り離して約分すると、
V=n(x12+x22+...+xn2)−μ2
いいかえると、
V=(x12,x22,...,xn2の平均値)−(x1,x2,...,xnの平均値)2
になる。
つまり、データの各値を二乗したものの平均値から、各値の平均値の二乗を引いても分散の計算が可能になる。