pandas之describe函数分析

pandas之describe函数分析,第1张

DataFrame.describe(percentiles=None, include=None, exclude=None)

描述统计数据,统计数据集的集中趋势,分散和行列的分布情况,不包括 NaN值

一、describe参数 
1、percentiles:设定数值型特征的统计量
      表示百分位数,介于0和1之间。默认值为 [.25,.5,.75],
      分别返回第25,第50和第75百分位数。        

2、include:'all',类似于dtypes列表或None(默认值),可选
      包含在结果中的数据类型的白名单,对于Series不可用。
     'all':输入的所有列都将包含在输出中。类似于dtypes的列表:将结果限制为提供的数据类型。
      numpy.number: 将结果限制为数字类型用法。
      numpy.object: 将其限制为对象列用法。
      字符串  df.describe(include=['O']))
      默认仅统计分析数值类型数据

3、exclude:类似于dtypes列表或None(默认值),可选,
      从结果中除去的黑名单数据类型列表。Series不可用。以下是选项:
      类似于dtypes的列表:从结果中排除提供的数据类型。
      无(默认):结果将不包含任何内容。

 二、统计变量说明
count:数量统计,此列共有多少有效值
unipue:不同的值有多少个
std:标准差
min:最小值
25%:四分之一分位数
50%:二分之一分位数
75%:四分之三分位数
max:最大值
mean:均值

三、参考

pandas.DataFrame.describe方法小析 - 知乎 (zhihu.com)

Pandas中describe()函数 

Python pandas.DataFrame.describe函数方法的使用-CJavaPy

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/714815.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-24
下一篇 2022-04-24

发表评论

登录后才能评论

评论列表(0条)

保存