什么是样本偏度:样本偏度的计算公式
偏度 ( skewness )是度量分布函数不对称程度的统计量。对于一个给定的序列xi,样本偏度的定义为:
这里m 2 是均方离差(即方差),m 3 是平均的立方离差。
负的偏度表示分布向左偏( skews left ),此时分布函数的左边会比右边延伸得更长;正的偏度表示分布函数向右偏。
上述计算样本偏度的公式在实际应用中使用得并不多。因为如果样本中存在异常值,那么这些异常值可能对偏度的值产生非常大的影响。另外一个评价分布函数非对称程度的方法是比较均值和中位数的大小。相比于中位数而言,均值更容易受极端值的影响,所以如果一个分布函数是向左偏的,那么该分布的均值就会小于中位数。
皮尔逊中值偏度系数 ( Pearson ’ s median skewness coefficient )就是一个基于这种思想的偏度度量(其中μ为均值,μ 1/2 为中位数):
gp = 3( μ-μ 1/2 )/σ
该统计量是偏度的一个 鲁棒 估计,它对异常值的影响不敏感。