DataFrame.describe(percentiles=None, include=None, exclude=None)
描述统计数据,统计数据集的集中趋势,分散和行列的分布情况,不包括 NaN值
一、describe参数1、percentiles:设定数值型特征的统计量
表示百分位数,介于0和1之间。默认值为 [.25,.5,.75],
分别返回第25,第50和第75百分位数。
2、include:'all',类似于dtypes列表或None(默认值),可选
包含在结果中的数据类型的白名单,对于Series不可用。
'all':输入的所有列都将包含在输出中。类似于dtypes的列表:将结果限制为提供的数据类型。
numpy.number: 将结果限制为数字类型用法。
numpy.object: 将其限制为对象列用法。
字符串 df.describe(include=['O']))
默认仅统计分析数值类型数据
3、exclude:类似于dtypes列表或None(默认值),可选,
从结果中除去的黑名单数据类型列表。Series不可用。以下是选项:
类似于dtypes的列表:从结果中排除提供的数据类型。
无(默认):结果将不包含任何内容。
二、统计变量说明
count:数量统计,此列共有多少有效值
unipue:不同的值有多少个
std:标准差
min:最小值
25%:四分之一分位数
50%:二分之一分位数
75%:四分之三分位数
max:最大值
mean:均值
三、参考
pandas.DataFrame.describe方法小析 - 知乎 (zhihu.com)
Pandas中describe()函数
Python pandas.DataFrame.describe函数方法的使用-CJavaPy
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)