在样本中,有50%的个体小于或者等于中位数,同时也有50%的个体大于或者等于中位数,所以,在频率分布直方图中,在中位数的左边和右边直方图的面积是相等的。从而我们可以根据这个来估算出中位数的大小值。
其实每个矩形的面积就是这组数据的频率。你把每个矩形的面积从左加起,加到接近05时(没超过)用05减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数。
比如:有4组数据:[0,10),[10,20),[20,30),[30,40],频率分别为01、02、03、04,那么你把前两组频率加起来,得03(再加第三组就超过05了),再05-03=02,再02/03约=067,再06710=67最后20+67=267
扩展资料:
中位数(又称中值,英语:Median),统计学中的专有名词,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
中位数特点:
1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。
2)有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。
3)趋于一组有序数据的中间位置。
区别联系:
1)平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
2)中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
3)众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
优缺点:平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。
参考资料:
众数就是频率最高的中间值
平均数则是每组频率的中间值乘频数再相加
若x1,x2,x3xn的平均数为m
则方差s^2=1/n[(x1-m)^2+(x2-m)^2++(xn-m)^2]
方差即偏离平方的均值,称为标准差或均方差,方差描述波动程度众
数:频率分布直方图中最高矩形的底边中点的横坐标
。
算术平均数:频率分布直方图每组数值的中间值乘以频数相加。
加权平均数:加权平均数就是所有的频率乘以数值后的和相加
中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐标。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)