pandas数据框:如何将describe()应用于每个组并添加到新列?

pandas数据框:如何将describe()应用于每个组并添加到新列?,第1张

pandas数据框:如何将describe()应用于每个组并添加到新列? 定义一些数据
In[1]:import pandas as pdimport iodata = """name scoreA      1A      2A      3A      4A      5B      2B      4B      6B      8    """df = pd.read_csv(io.StringIO(data), delimiter='s+')print(df)

Out[1]:  name  score0    A      11    A      22    A      33    A      44    A      55    B      26    B      47    B      68    B      8

解决此问题的一种好方法是使用生成器表达式(请参见脚注

pd.Dataframe()
来迭代的结果
groupby
,并动态构建摘要统计数据框:

In[2]:df2 = pd.Dataframe(group.describe().rename(columns={'score':name}).squeeze()   for name, group in df.groupby('name'))print(df2)

Out[2]:   count  mean       std  min  25%  50%  75%  maxA      5     3  1.581139    1  2.0    3  4.0    5B      4     5  2.581989    2  3.5    5  6.5    8

此处,

squeeze
函数压缩维度,以将单列组摘要统计信息
Dataframe
转换为
Series

脚注 :生成器表达式的形式为

my_function(a) for a initerator
,或者是否
iterator
给我们返回两个元素
tuples
,例如
groupby
my_function(a,b) fora,b in iterator



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5013880.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-14
下一篇 2022-11-14

发表评论

登录后才能评论

评论列表(0条)

保存