如果是绝对值:应该是:|x-E(x)|,而方差为:(x-E(x))^2。
看看上面的形式,我们就知道,其实结局是一样的,就是为了保证他的正号性。
也就是说,偏差有正有负,不能出现正偏差+负偏差=0,但是单个的偏差很大,也就是很离散。
两者均可以表示样本的离散程度.而选择方差是便于计算。
在计算机上,我们只需要做一些平方和,就行,而绝对值,则需要进行变号处理.然后相加,程序的复杂度增加,(尤其处理大样本容量时),所以 方差胜出!
两者其实无本质的区别!
信息注记二:
在应用问题中经常用求分散程度的极小值,在求极值时x^2这个函数在每一点都可导,而|x|这个函数在x=0不可导,所以说用绝对值式子不方便。
除了放大距离远的点之外,还有很重要的一点是理论分析比较方便。
x^2是光滑函数,而绝对值函数不可微。
平均值一定是使得[公式]最小的那一点。
但使得绝对值最小的可能是一个区间。
信息注记三:
问题一:如果要从甲、乙两名选手中选拔一名参加射击比赛?你将设计什么方案?
S:总分高的。
T:若有一名选手射击5次,总分30;而另一名选手射击10次,总分50分,你又会选择谁?
S:看来还是算平均分合适。
问题二:你选择谁?
甲:3、5、6、7、9
乙:4、5、6、7、8
从数据中,可以看出用平均数来选拔是不可取的。尽管平均环数相同,但二人的水平还是有差距的。让学生充分研讨,经过观察分析数据,比较容易达成这样的共识:甲最多9,最少3环,波动范围较大,而乙最多8,最少4,波动范围较小。因此乙较稳定,应该选拔乙。
问题三:极大值与极小值的差能分析准确吗?
甲:3、5、6、7、9
丙:3、6、6、6、9
不难发现,虽然最多比最少差距相同,但丙比甲要稳定。同时还发现:在平均数相同的情况下,单纯比较最大与最小两个数据,不能够说明一组数据的整体波动情况,每个数据都有决定权。那么又如何反映一组数据的波动情况?
S:用各个数据减去它们的平均数,得到各个数据的偏差;再将各偏差相加。
经过一算:不难得出甲、乙、丙的偏差和都为0。到这一步,同学们会突然想到去掉偏差的负号问题。老师引导学生进行探索、分析,最后归纳出两种方法。(1)先求各偏差的绝对值,再相加;(2)先求各偏差的平方,再相加。
问题四:算一算下列数据的偏差和。
甲:3、5、6、7、9
乙:4、5、6、7、8
丙:3、6、6、6、9
用方法一算得:甲:8;乙:6;丙:6(又如何比较乙、丙的稳定性呢?)
用方法二算得:甲:20;乙:10;丙:18(这种算法算得,三者的稳定性都不一样?也让学生初步体会用平方而不用绝对值的目的就是将数据间的差距拉大)
问题五:乙孤军奋战(求偏差平方和):
第一阶段:4、5、6、7、8
第二阶段:4、5、6、7、8、4、5、6、7、8
第三阶段:4、5、6、7、8、4、5、6、7、8、4、5、6、7、8
……
从上面的计算看出:单求偏差平方和,易因“数据越多而导致偏差平方和也越大”的结论,而实际上它们的稳定性应该是相同的。从而得出结论:只有求得“偏差的平方”的平均数才能真实地描述波动特征。