python – 确保groupby输出类型_python

概述考虑这个例子： import pandas as pdimport numpy as npfoo = pd.DataFrame(dict(letter=['a', 'a', 'a', 'b', 'b', 'b', 'a', 'b'], number=[1,1,2,2,3,np.nan, np.nan,4]))grouped = foo.groupby(foo 考虑这个例子：

import pandas as pdimport numpy as npfoo = pd.DataFrame(dict(letter=['a','a','b','b'],number=[1,1,2,3,np.nan,4]))grouped = foo.groupby(foo.number)print grouped['letter'].transform(lambda x: sum(x=='a'))Out[18]: 0    21    22    13    14    05    b6    a7    0

不是在第5行和第6行上显示1,而是显示’a’和’b’,大概是因为groupby被索引在np.nan值上.有没有办法阻止这种情况发生,而不用一些虚拟变量替换nan值？另外 – 为什么会这样？

解决方法大熊猫文档在这里解释： http://pandas.pydata.org/pandas-docs/stable/missing_data.html

NAN被排除在外,这与R一致.

早期版本的Pandas确实包含了它们,但它们已被删除.

总结

以上是内存溢出为你收集整理的python – 确保groupby输出类型全部内容，希望文章能够帮你解决python – 确保groupby输出类型所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/langs/1197468.html

python – 确保groupby输出类型

发表评论

评论列表（0条）