什么时候使用df.value_counts()和df.groupby('...')。count()?

什么时候使用df.value_counts()和df.groupby('...')。count()?,第1张

什么时候使用df.value_counts()和df.groupby('...')。count()?

差额

value_counts
收益:

结果对象将按降序排列,以便第一个元素是最频繁出现的元素。

count
不是,它对输出排序
index
(由中的列创建
groupby('col')
)。


df.groupby('colA').count()

是用于

df
按功能汇总所有列的,
count.
因此它计算不包括
NaN
s的值。

因此,如果

count
仅需要一列,则:

df.groupby('colA')['colA'].count()

样品

df = pd.Dataframe({'colB':list('abcdefg'),        'colC':[1,3,5,7,np.nan,np.nan,4],        'colD':[np.nan,3,6,9,2,4,np.nan],        'colA':['c','c','b','a',np.nan,'b','b']})print (df)  colA colB  colC  colD0    c    a   1.0   NaN1    c    b   3.0   3.02    b    c   5.0   6.03    a    d   7.0   9.04  NaN    e   NaN   2.05    b    f   NaN   4.06    b    g   4.0   NaNprint (df['colA'].value_counts())b    3c    2a    1Name: colA, dtype: int64print (df.groupby('colA').count())      colB  colC  colDcolA       a        1     1     1b        3     2     2c        2     2     1print (df.groupby('colA')['colA'].count())colAa    1b    3c    2Name: colA, dtype: int64


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5644004.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存