使用pandas的insert方法,第一个参数指定插入列的位置,第二个参数指定插入的列名,第三个参数指定插入列的数据。
直接对dataframe赋值
使用reindex函数,还可以指定缺失值填充的值,不过缺点是要把原有的列名和新列名都加上,如果列名较多,那就比较麻烦了。
在Pandas的DataFrame中添加一行或者一列,添加行有 df.loc[] 以及 df.append() 这两种方法,添加列有 df[] 和 df.insert() 两种方法, 下面对这几种方法的使用进行简单介绍。
采用 loc[] 方法多适用于对空的dataframe循环遍历添加行,这样索引可以从0开始直到数据结果,不会存在索引冲突的问题。
不过在使用insert的过程中发现 454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code) 这个提示,猜测是有别的地方出问题了,还需要调试。
主要参考资料:
当我们需要将dataframe中的某一列数据装换为其它类型或者做一些其它的算法后,再新增加到datafram中时,最有效的方法是使用自定义的udf函数。本文的例子是将id列的数据转换为double类型,然后将该列数据增加到dataframe中欢迎分享,转载请注明来源:内存溢出
评论列表(0条)