更好地在熊猫中进行分箱

更好地在熊猫中进行分箱,第1张

更好地在熊猫中进行分箱

也许您正在寻找pandas.cut:

import pandas as pdimport numpy as npdf = pd.Dataframe(np.arange(50), columns=['filtercol'])filter_values = [0, 5, 17, 33]   out = pd.cut(df.filtercol, bins=filter_values)counts = pd.value_counts(out)# counts is a Seriesprint(counts)

产量

(17, 33]    16(5, 17]     12(0, 5]       5

要对结果重新排序以使bin范围按顺序显示,您可以使用

counts.sort_index()

产生

(0, 5]       5(5, 17]     12(17, 33]    16

另请参见离散化和量化



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5655136.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存