对Pandas DataFrame进行分组，计算一列的均值和标准差，并使用reset_index将std添加为新列

陶瓷气体放电管 • 2022-12-15 • 随笔 • 阅读 19

您可以使用以下

groupby-agg

*** 作：

In [38]: result = df.groupby(['a'], as_index=False).agg({'c':['mean','std'],'b':'first', 'd':'first'})

然后重命名各列并对其重新排序：

In [39]: result.columns = ['a','c','e','b','d']In [40]: result.reindex(columns=sorted(result.columns))Out[40]:         a  b    c  d         e0   Apple  3  4.5  7  0.7071071  Banana  4  4.0  8       NaN2  Cherry  7  1.0  3       NaN

熊猫默认情况下会计算样本std。要计算总体标准：

def pop_std(x):    return x.std(ddof=0)result = df.groupby(['a'], as_index=False).agg({'c':['mean',pop_std],'b':'first', 'd':'first'})result.columns = ['a','c','e','b','d']result.reindex(columns=sorted(result.columns))

产量

        a  b    c  d    e0   Apple  3  4.5  7  0.51  Banana  4  4.0  8  0.02  Cherry  7  1.0  3  0.0

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5617190.html

计算熊猫分组样本排序

打赏

微信扫一扫

支付宝扫一扫

陶瓷气体放电管一级用户组

0 0

更改matplotlib轴设置

上一篇 2022-12-15

获取推文来自特定用户的特定推文

下一篇 2022-12-15

发表评论

登录后才能评论

对Pandas DataFrame进行分组，计算一列的均值和标准差，并使用reset_index将std添加为新列

发表评论

评论列表（0条）