DataFrame新增列的方法_IT百科

引入需用的包，并新建DataFrame的例子：

使用pandas的insert方法，第一个参数指定插入列的位置，第二个参数指定插入的列名，第三个参数指定插入列的数据。

直接对dataframe赋值

使用reindex函数，还可以指定缺失值填充的值，不过缺点是要把原有的列名和新列名都加上，如果列名较多，那就比较麻烦了。

在Pandas的DataFrame中添加一行或者一列，添加行有 df.loc[] 以及 df.append() 这两种方法，添加列有 df[] 和 df.insert() 两种方法，下面对这几种方法的使用进行简单介绍。

采用 loc[] 方法多适用于对空的dataframe循环遍历添加行，这样索引可以从0开始直到数据结果，不会存在索引冲突的问题。

不过在使用insert的过程中发现 454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code) 这个提示，猜测是有别的地方出问题了，还需要调试。

主要参考资料：

当我们需要将dataframe中的某一列数据装换为其它类型或者做一些其它的算法后，再新增加到datafram中时，最有效的方法是使用自定义的udf函数。本文的例子是将id列的数据转换为double类型，然后将该列数据增加到dataframe中

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/bake/11238565.html

DataFrame新增列的方法

发表评论

评论列表（0条）