获取多个pandas数据框的均值

获取多个pandas数据框的均值,第1张

获取多个pandas数据框的均值

假设两个数据框具有相同的列,则可以将它们串联起来,然后在串联的帧上计算汇总统计信息:

import numpy as npimport pandas as pd# some random data framesdf1 = pd.Dataframe(dict(x=np.random.randn(100), y=np.random.randint(0, 5, 100)))df2 = pd.Dataframe(dict(x=np.random.randn(100), y=np.random.randint(0, 5, 100)))# concatenate themdf_concat = pd.concat((df1, df2))print df_concat.mean()# x   -0.163044# y    2.120000# dtype: float64print df_concat.median()# x   -0.192037# y    2.000000# dtype: float64
更新资料

如果要计算两个数据集中具有相同索引的每组行的统计信息,可以使用

.groupby()
按行索引对数据进行分组,然后应用均值,中位数等:

by_row_index = df_concat.groupby(df_concat.index)df_means = by_row_index.mean()print df_means.head()#x    y# 0 -0.850794  1.5# 1  0.159038  1.5# 2  0.083278  1.0# 3 -0.540336  0.5# 4  0.390954  3.5

即使您的数据帧中的行数不相等,此方法也可以使用-如果两个数据帧之一中缺少特定的行索引,则将在单个现有行上计算均值/中值。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5645072.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存