python – 确保groupby输出类型

python – 确保groupby输出类型,第1张

概述考虑这个例子: import pandas as pdimport numpy as npfoo = pd.DataFrame(dict(letter=['a', 'a', 'a', 'b', 'b', 'b', 'a', 'b'], number=[1,1,2,2,3,np.nan, np.nan,4]))grouped = foo.groupby(foo 考虑这个例子:

import pandas as pdimport numpy as npfoo = pd.DataFrame(dict(letter=['a','a','b','b'],number=[1,1,2,3,np.nan,4]))grouped = foo.groupby(foo.number)print grouped['letter'].transform(lambda x: sum(x=='a'))Out[18]: 0    21    22    13    14    05    b6    a7    0

不是在第5行和第6行上显示1,而是显示’a’和’b’,大概是因为groupby被索引在np.nan值上.有没有办法阻止这种情况发生,而不用一些虚拟变量替换nan值?另外 – 为什么会这样?

解决方法 大熊猫文档在这里解释: http://pandas.pydata.org/pandas-docs/stable/missing_data.html

NAN被排除在外,这与R一致.

早期版本的Pandas确实包含了它们,但它们已被删除.

总结

以上是内存溢出为你收集整理的python – 确保groupby输出类型全部内容,希望文章能够帮你解决python – 确保groupby输出类型所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1197468.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存