必须计算离散系数来比较两个数列的离散程度大小,平均数大的标准差亦大,平均数小的标准差亦小,两数列的计量单位不同。
离散系数反映单位均值上的离散程度,常用在两个总体均值不等的离散程度的比较上。若两个总体的均值相等,则比较标准差系数与比较标准差是等价的。
一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。
扩展资料:
一组数据计算它的离散度:
1、极差
最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法最为常见,比如比赛中去掉最高最低分就是极差的具体应用。
2、离均差的平方和
由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度,越大离散度也就越大。
但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数相加为零的。为了避免正负问题。
在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值相加。而为了避免符号问题,数学上最常用的是另一种方法——平方,这样就都成了非负数。因此,离均差的平方累加成了评价离散度一个指标。
3、方差(S2)
由于离均差的平方累加值与样本个数有关,只能反应相同样本的离散度,而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将标准差求平均值,这就是我们所说的方差成了评价离散度的较好指标。
我们知道,样本量越大越能反映真实的情况,而算数均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中样本的均差多是除以自由度(n–1),它的意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n–1。
4、标准差(SD)
由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。
参考资料来源:百度百科-离散系数
参考资料来源:百度百科-标准差
先求方差,方差越大的离散度越大标准差是方差的平方根,意思是一样的,仍然是越大越分散。
但标准差在单位上和需计算的数据一样,比如,计算几个长度数据的方差,单位是平方米,而标准差由于开了根号,单位仍然是米。
集中趋势指标:算术均数,几何均数,中位数和百分位数。
集中趋势适用情况:对称分布或偏度不大的资料,尤其适合正态分布资料。
离散趋势指标:极差,方差,标准差,四分位数间距。
离散趋势适用情况:均数相差不大,单位相同的资料。
在统计学中,集中趋势或中央趋势,在口语上也经常被称为平均,表示一个机率分布的中间值。最常见的几种集中趋势包括算数平均数、中位数及众数。集中趋势可以由有限的数组中或理论上的机率分配中求得。
计量资料的频数分布有集中趋势和离散趋势两个主要特征。仅仅用集中趋势来描述数据的分布特征是不够的,只有把两者结合起来,才能全面地认识事物。我们经常会碰到平均数相同的两组数据其离散程度可以是不同的。
扩展资料:
各指标计算方法:
极差又称全距,是指一组数据的观察值中的最大值和最小值之差。
极差的计算较简单,但是它只考虑了数据中的最大值和最小值,而忽略了全部观察值之间的差异。两组数据的最大值和最小值可能相同,于是它们的极差相等,但是离散的程度可能相当不一致。
平均差是指一组数据中的各数据对平均数的离差绝对值的平均数。一组数据中的各数据对平均数的离差有正有负,其和为零,因此平均差必须用离差的绝对值来计算。平
平均差用绝对值来度量,虽然避免了正负离差的相互抵消,但不便于运算。一般情况下,可用方差来度量一组数据的离散性。方差通常用字母σ2来表示。
算术平均数:算术平均数就是观察值的总和除以观察值个数的商,是集中趋势测定中最重要的一种,它是所有平均数中应用最广泛的平均数。算术平均数分为简单算术平均数和加权算术平均数。
调和平均数:调和平均数可以看成是变量χ的倒数的算术平均数的倒数,故有时也被称为“倒数平均数”。调和平均数分为简单调和平均数和加权调和平均数。
参考资料来源:
百度百科—集中趋势
百度百科—离散趋势
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)