pandas 列的 *** 作_随笔

pandas 列的 *** 作 padas对列的 *** 作 1、loc和iloc

loc适用于索引中的标签。
iloc在索引中的位置上起作用。
##1.1 loc基于行标签和列标签（x_label、y_label）进行索引
.loc先行后列，中间用逗号（,）分割，
#取 a 和 A 对应的数据df.loc[‘a’,‘A’]
#取前两行对应数据df.loc[‘a’:‘b’,:]
#取前两列对应数据df.loc[:,‘A’:‘B’]
#取前两行和前两列对应数据df.loc[‘a’:‘b’,‘A’:‘B’]
#上面的例子取的都是连续的行和列，若取第一行和第四行、第一列和第四列对应的数据，则df.loc[[‘a’,‘d’],[‘A’,‘D’]]

1.2 iloc 基于行索引和列索引（index，columns）都是从 0 开始
如果数据的行标签和列标签名字太长或不容易记，则用 iloc 很方便，只需记标签对应的索引即可
#df.iloc[0,0]
#取前两行对应数据df.iloc[0:2,:]
#取前两列对应数据df.iloc[:,0:2]
#取前两行和前两列对应数据df.iloc[0:2,0:2]
#上面的例子取的都是连续的行和列，若取第一行和第四行、第一列和第四列对应的数据，df.iloc[[0,3],[0,3]]

2、统计某一列中各个值的出现次数

比如要统计’label’这一列各个值出现的次数,
法一：df.loc[:,col_name].value_counts()
法二：df[col_name].value_counts()

3、删除若干列

dataframe.drop([“a”,“b”,“c”], axis=1)

4、删除列数据

del(dataframe[‘G’])

5、增加列数据

			dataframe[‘G’] = series
          dataframe[‘G’] = dataframe[‘A’] + 4

6、对某一列重新赋值

dataframe[‘G’] = 100 指定列所有值均为100

7、对值排序

df.sort_values(by=“open”, ascending=False)
df.sort_values(by=[‘open’, ‘high’]) 
by：指定排序参考的键，单个键或者多个键进行排序，ascending：默认True升序，False降序

8、对索引排序

dataframe.sort_index() ascending:默认True升序，False降序

9、获取列数据

（1）dataframe[‘A’] <=> dataframe.A  #新series 通过列索引获取列数据
（2）dataframe[[‘A’]]                #新Dataframe 只有一列，双层中括号
（3）dataframe[[‘a’,‘c’]]            #新Dataframe 多列，双层中括号，不是连续索引

10、直接获取某一个值

dataframe[‘A’] [‘2018-02-27’] #对应位置的值	直接使用行列索引名字的方式（先列后行）

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5521592.html

pandas 列的 *** 作

发表评论

评论列表（0条）