方差和标准差,这两样东西看着有点像,实际上东西全不一样。别跟我扯啥“统计学基石”,咱直接说人话。方差就是描述数据的“脾气”,标准差就是那个“脾气大小”的倍数。 你能够把数据想成一群人的身高。
比方说,一群 180 厘米的人,身高方差挺大,说明有人高 185,有人矮 175,大家参差不齐;那他们的标准差就是 6 厘米,这个数值直接告诉你“大家都差不多”。
要是另一群人都是 180 厘米,方差是 0,那标准差也是 0。
这时候方差和标准差,彻底就是两个概念,一个看差异程度,一个看差异的缩放比例。 方差公式实际上挺好办,就是每个数据跟平均值差的平方,加起来再除以个数。标准差就是方差开根号。
这听起来有点玄乎,但逻辑挺直白。当你算出方差是 100,说明平均偏差是 10,那标准差就是 10,这就好比你问“这个方差能多大?”的时候,标准差给你一个直观的线性参考;但要是你问“这个方差能不能放大 2 倍”,那标准差就把答案变成了 20,这就好比在问“这个方差能扩大到多少?”。
你看,有时候你认定没区别,实际上一个是倍数关系,一个是平方关系。 举个具体的例子吧。假设你有两组数据,A 组是 [10, 12, 10],B 组是 [100, 100, 100]。先算 A 组的方差吧。平均值是 10.667。10 跟 10.667 差 0.667,平方是 0.44;12 跟 10.667 差 1.333,平方是 1.77。加起来除以 3,方差大约是 1.167。开根号,标准差就是 1.09。
你看,这组数据别看有两个 10,但波动不算忒大,大家比较聚拢在 10 左右。 再看看 B 组。平均值还是 100。100 跟 100 差 0,平方是 0;再 0,还是 0。加起来除以 3,方差是 0。标准差是 0。
这时候你会认定 B 组数据忒稳了吧?对,出于方差是 0,意味着所有数据都没动。但要是你问“方差是 1,标准差是多少?”这个难题,B 组没法回答,出于分母是 0 了。
这就是方差和标准差的本质区别:方差是平方后的程度,标准差是线性后的程度。 要是你面对一组数据,比如测试成绩,90、92、91、90、88。平均值 90.2。90 差 0.2 平方 0.04;92 差 1.8 平方 3.24;91 差 0.8 平方 0.64;90 又 0.04;88 差 -2.2 平方 4.84。总和约 9,除以 5 方差是 1.8,标准差 sqrt(1.8) 约 1.34。
这能解释清楚吗?能。1.34 这个数,意味着平均偏差是 1.34 分。
要是另一组数据平均偏差是 3 分,那标准差就是 3,这就直接告诉你那组数据的波动是前者的两倍,不用再去算平方根的费事。 实际上啊,通俗点说,方差是“绝对偏差”,标准差是“相对偏差”。方差告诉你具体差了多少,标准差告诉你这个差占比多少。
比如你身高 175 和 185,方差绝对差是 2,相对差取决于平均值。
要是平均值是 180,那 175 就差了 5 厘米,185 就长了 5 厘米,标准差就是 5;要是平均值是 170,那 175 就差了 5,185 就长了 15,标准差就是 15。
这时候方差是 4,标准差就是 15。
这说明方差是一个定值,而标准差会随平均数变化。 再深入点,你能够把方差想象成距离平方的总和,把标准差想象成平均距离的平方根。方差是个“距离总和”,标准差是“平均距离”。
要是数据聚拢得极严,方差小,标准差也小;数据分散,方差大,标准差也大。它们都描述了数据的离散程度,这是共同点。但一个是二次函数,一个是开方后的线性函数,这害得它们的数值量级差异庞大。 举个例子,数据 1, 1, 1, 1。平均值 1,方差 0,标准差 0。数据变成 100, 100, 100, 100,方差还是 0,标准还是 0。数据变成 0, 1, 2, 3。平均值 1.5。方差是 0.5,标准差是 0.7。
这里你能够看到,啥是标准差,它能把方差缩小一个数量级,给你个更紧凑的参考。但要是数据是 1000, 1001, 1005, 1010。平均值 1004.5。方差大约是 25,标准差是 5。
你看,同样的波动,随着数据变大,方差和标准差都会变大,但增速不一样。 故此啊,方差和标准差,一个看“绝对差异”,一个看“相对差异”。
有时候你认定方差是 1,标准差是 1,没啥区别,认定这代表波动不大。但实际上,方差是 1 可能代表绝对差是 1,标准差是 1 可能代表绝对差是 1。
这取决于你的参照系。方差告诉你“差多少平方”,标准差告诉你“差多少”。 在应用里,要是你要比较不同组别的成绩分布,方差直接看绝对偏差;要是你想评估风险,标准差更合适,出于它跟平均值挂钩。方差是离散程度的“底牌”,标准差是离散程度的“倍率”。
记住这个就好,别被公式搞晕了。数据本身最真,公式只是帮你看清数据的形状。方差是平方后的余温,标准差是开方后的温度。方长长高,开方后矮小,但都能说清楚数据散不散。
这就是它们唯一的区别,一个平方,一个开根,这就是全体。