熊猫不可能将
NaN值存储在整数列中。
这
float显然是数据存储的默认选择,因为一旦丢失值出现,Pandas就必须更改整个列的数据类型。在实践中,经常会出现缺失值。
至于 为什么, 这是继承自Numpy的限制。基本上,熊猫需要预留特定的位模式来表示
NaN。这对于浮点数很简单,它是在IEEE
754标准中定义的。对于固定宽度的整数,这样做比较麻烦且效率较低。
更新资料
激动人心的新闻在熊猫0.24。IntegerArray是一项实验性功能,但可能会使我的原始答案过时了。因此,如果您在2019年2月27日或之后阅读本文,请查看该功能的文档。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)