import pandas as pdimport numpy as npfoo = pd.DataFrame(dict(letter=['a','a','b','b'],number=[1,1,2,3,np.nan,4]))grouped = foo.groupby(foo.number)print grouped['letter'].transform(lambda x: sum(x=='a'))Out[18]: 0 21 22 13 14 05 b6 a7 0
不是在第5行和第6行上显示1,而是显示’a’和’b’,大概是因为groupby被索引在np.nan值上.有没有办法阻止这种情况发生,而不用一些虚拟变量替换nan值?另外 – 为什么会这样?
解决方法 大熊猫文档在这里解释: http://pandas.pydata.org/pandas-docs/stable/missing_data.htmlNAN被排除在外,这与R一致.
早期版本的Pandas确实包含了它们,但它们已被删除.
总结以上是内存溢出为你收集整理的python – 确保groupby输出类型全部内容,希望文章能够帮你解决python – 确保groupby输出类型所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)