有时候我们需要修改DataFrame的个别列名或者索引,避免重复、方便使用。
这时就需要使用到rename()函数,rename()函数使用时比较简单。
源数据
现在我们想要把'表1Lat'和'表1Lon'改为维度和经度:
其中columns代表要对列名进行修改,在Python的pandas库里面,跟列名有关的一般都是用columns,而不是用names。在columns后面是一个字典形式,键是原列名,值是新列名。修改的时候只会改选择到的列。注意修改只会要写入源数据时需要赋值或者用inplace = True。
rename()函数适合于修改个别的索引或者列名,如果需要大部分的修改或者全部修改的话就使用set_index()函数比较方便。
多层索引或者列名怎么修改?
Excel文件中可能包含合并单元格的数据,如以下形式,直接使用pandas进行处理会带来问题。
首先明确合并单元格存储数据原理,即数据只存储在合并单元格的左上角,其他位置存储的是NaN。
将以上表格的表头处理成['姓名', '基本信息_身高', '基本信息_体重', '基本信息_性别', ’成绩', '成绩']
因为成绩列合并了两列单元格,上述处理会带来重复表头问题,同时数据中也存在合并单元格问题,数据只存在最左单元格中。需要删除重复表头,保留数据列
根据行索引和列名,获取一个元素的值
根据行索引和列索引获取 元素值
选取元素,或者行
选取元素
选取行返回一个series
选取行列返回dataframe
按索引选取元素
获取行的series
到此这篇关于详解pandas获取[Dataframe]
原文:
1、 详解pandas获取Dataframe元素值的几种方法
2、 >
1、删除一列:
Del df[column] -> df的列直接被删除;
Dfdrop(col,axis=1) -> 删除一列,不改变原df,重新赋值一个新的df
Dfdrop(col,axis=1,inplace=True) -> 直接改变原df的值
2、查看df每列数据类型:
Df[col]dtype==‘object’ == True
Df[col]dtype==‘int’ == True
Df[col]dtype==‘float’ == True
3、强制修改df某列类型:
Df[col]=df[col]astype(float) -> 将col列改为float类型
4、DataFrame中方差为0的列:
Series=dfvar() ## 获取方差series
Lst_col=Series[Seriesvalues == 0]indextolist()
5、打印异常
try:
Execute()
Exception as err:
Print(err)
以上就是关于09.pandas修改列名、索引名字全部的内容,包括:09.pandas修改列名、索引名字、pandas:处理合并单元格、详解pandas获取Dataframe元素值的几种方法等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)