熊猫:为什么数字浮点数的默认列类型是?

熊猫:为什么数字浮点数的默认列类型是?,第1张

熊猫:为什么数字浮点数的默认列类型是?

熊猫不可能将

NaN
值存储在整数列中。

float
显然是数据存储的默认选择,因为一旦丢失值出现,Pandas就必须更改整个列的数据类型。在实践中,经常会出现缺失值。

至于 为什么, 这是继承自Numpy的限制。基本上,熊猫需要预留特定的位模式来表示

NaN
。这对于浮点数很简单,它是在IEEE
754标准中定义的。对于固定宽度的整数,这样做比较麻烦且效率较低。

更新资料

激动人心的新闻在熊猫0.24。IntegerArray是一项实验性功能,但可能会使我的原始答案过时了。因此,如果您在2019年2月27日或之后阅读本文,请查看该功能的文档。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5650893.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存