pandas之describe函数分析_python

DataFrame.describe(percentiles=None, include=None, exclude=None)

描述统计数据，统计数据集的集中趋势，分散和行列的分布情况，不包括 NaN值

一、describe参数

1、percentiles：设定数值型特征的统计量
      表示百分位数，介于0和1之间。默认值为 [.25,.5,.75]，
      分别返回第25，第50和第75百分位数。        

2、include：'all'，类似于dtypes列表或None（默认值），可选
      包含在结果中的数据类型的白名单，对于Series不可用。
     'all'：输入的所有列都将包含在输出中。类似于dtypes的列表：将结果限制为提供的数据类型。
      numpy.number： 将结果限制为数字类型用法。
      numpy.object： 将其限制为对象列用法。
      字符串  df.describe(include=['O'])）
      默认仅统计分析数值类型数据

3、exclude：类似于dtypes列表或None（默认值），可选，
      从结果中除去的黑名单数据类型列表。Series不可用。以下是选项：
      类似于dtypes的列表：从结果中排除提供的数据类型。
      无（默认）：结果将不包含任何内容。

二、统计变量说明

count：数量统计，此列共有多少有效值
unipue：不同的值有多少个
std：标准差
min：最小值
25%：四分之一分位数
50%：二分之一分位数
75%：四分之三分位数
max：最大值
mean：均值

三、参考

pandas.DataFrame.describe方法小析 - 知乎 (zhihu.com)

Pandas中describe()函数

Python pandas.DataFrame.describe函数方法的使用-CJavaPy

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/714815.html

pandas之describe函数分析

发表评论

评论列表（0条）