离散程度,英文名Measures of Dispersion,也称为统计变异性(statistical variability),简称变异、变差(variation)、变率,是指一个分布或
随机变量的拉伸或压缩程度。它是通过随机地观测变量各个取值之间的差异程度,用来衡量风险大小的指标。
1. 通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小,从而也就可以反映分布中心的指标对各个观测变量值代表性的高低。
2. 通过对随机变量取值之间离散程度的测定,可以反映随机变量次数分布密度曲线的瘦俏或矮胖程度。
3. 离散程度与
集中趋势相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。
衡量离散程度的值通常是非负
实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,
随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。例如,如果随机变量的单位是米或秒,则这些量的单位也是米或秒。这些量包括
标准差、四分位距、全距、平均绝对偏差和绝对差
中位数。此外,也有一些
无量纲量,如
变异系数、四分位离散系数、
基尼系数和。还有一些带单位的量,但是他们的单位和随机变量本身的单位不同,如
方差和离散指数。
可用来测度观测变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要有极差、
平均差和标准差等几种。
极差又称全距,是观测变量的最大取值与最小取值之间的
离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。
平均差是总体各单位标志对其算术平均数的离差
绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。
标准差是
随机变量各个取值偏差平方的
平均数的算术平方根,是最常用的反映随机变量分布离散程度的指标。标准差既可以根据样本数据计算,也可以根据观测变量的理论分布计算,分别称为样本标准差和总体标准差。
例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二个集合具有较小的
标准差。
标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为值都落在一定数值范围之外,可以合理推论预测值是否正确。