标准差的算法:标准差=√[Σ(xi-x)^2/(N-1)]例子如下:
其中xi是每个数据点,x是整个数据集的平均值,N是数据点的个数。举个例子,假设有以下数据集:3,5,7,9,11。首先,计算平均值:x=(3+5+7+9+11)/5=7。计算每个数据点与平均值的差的平方:(3-7)^2=16,(5-7)^2=4,(7-7)^2=0,(9-7)^2=4,(11-7)^2=16。
将这些差的平方加起来:16+4+0+4+16=40。然后,将这个总和除以数据点数减一:40/(5-1)=10。最后,取这个值的平方根:√10≈3.16。因此,这个数据集的标准差为3.16。
标准差(Standard Deviation),数学术语,是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。标准差也被称为标准偏差,或者实验标准差,在概率统计中最常使用作为统计分布程度上的测量依据。
标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。在实验中单次测量总是难免会产生误差,为此我们经常测量多次,然后用测量值的平均值表示测量的量,并用误差条来表征数据的分布,其中误差条的高度为±标准误差。
公式意义:
所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差。深蓝区域是距平均值一个标准差之内的数值范围。在正态分布中,此范围所占比率为全部数值(即1)之68.2%。
对于正态分布,两个标准差之内(深蓝,蓝)的比率合起来为95.4%。对于正态分布,正负三个标准差之内(深蓝,蓝,浅蓝)的比率合起来为99.6%。由于标准差的这个性质,得出了三西格玛准则(three-sigma guideline)。