stata描述性统计怎么加入峰度偏度

stata描述性统计怎么加入峰度偏度,第1张

偏度和峰度
偏度(skewness)
数据分布的的不对称性称为偏态。偏态是指数据分布的偏斜方向和程度。偏度,通常分为右偏(正偏)和左偏(负偏)两种。它们是以对称分布为标准相比较而言的。
在对称分布的情况下,平均数、中位数和众数是合而为一的。
在偏态分布的情况下,平均数、中位数与众数是分离的。如果众数在左边,平均数在右边,即数据的极端值在右边,数据分布曲线向右延伸,则称为右向偏态。右向偏态,众数的数值较小,平均数的数值较大,平均数与众数之差为正值,因此右向偏态又称为正向偏态。
如果众数在右边,平均数在左边,即数据的极端值在左边,数据分布曲线向左延伸,则称为左向偏态。
偏度(Skewness)就是分布不对称的程度。正态分布是完全对称的,所以正态分布的偏度为零。但是现实中很多分布是不对称的,有的偏向左边,有的偏向右边,所以就用偏度来衡量分布偏离的程度。
偏度是离群值(Outliers)导致的。离群值是那些正数中特别大或者负数中特别小的值,也就是绝对值特别大的值。从名字也可以看出来,这些数值特别不合群,不是特别大,就是特别小,有点离群索居的感觉,所以叫做离群值。
参考


峰度(kurtosis)
峰度(Kurtosis)是衡量某个分布相比正态分布而言,其峰值高低的程度。其中,尖峰态(Leptokurtic)就是比正态分布更尖的一种分布,低峰态(Platykurtic)是指没有正态分布那么尖的一种分布,常峰态(Mesokurtic)就是峰值和正态分布相同的分布。



df_train['test']skew() # 偏度
df_train['test']kurt() #


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/10257969.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存