DataFrame新增列的方法

DataFrame新增列的方法,第1张

引入需用的包,并新建DataFrame的例子:

使用pandas的insert方法,第一个参数指定插入列的位置,第二个参数指定插入的列名,第三个参数指定插入列的数据

直接对dataframe赋值

使用reindex函数,还可以指定缺失值填充的值,不过缺点是要把原有的列名和新列名都加上,如果列名较多,那就比较麻烦了。

在Pandas的DataFrame中添加一行或者一列,添加行有 df.loc[] 以及 df.append() 这两种方法,添加列有 df[] 和 df.insert() 两种方法, 下面对这几种方法的使用进行简单介绍。

采用 loc[] 方法多适用于对空的dataframe循环遍历添加行,这样索引可以从0开始直到数据结果,不会存在索引冲突的问题。

不过在使用insert的过程中发现 454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code) 这个提示,猜测是有别的地方出问题了,还需要调试。

主要参考资料:

当我们需要将dataframe中的某一列数据装换为其它类型或者做一些其它的算法后,再新增加到datafram中时,最有效的方法是使用自定义的udf函数。本文的例子是将id列的数据转换为double类型,然后将该列数据增加到dataframe中


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11238565.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-14
下一篇 2023-05-14

发表评论

登录后才能评论

评论列表(0条)

保存