loc适用于索引中的标签。
iloc在索引中的位置上起作用。
##1.1 loc基于行标签和列标签(x_label、y_label)进行索引
.loc先行后列,中间用逗号(,)分割,
#取 a 和 A 对应的数据df.loc[‘a’,‘A’]
#取前两行对应数据df.loc[‘a’:‘b’,:]
#取前两列对应数据df.loc[:,‘A’:‘B’]
#取前两行和前两列对应数据df.loc[‘a’:‘b’,‘A’:‘B’]
#上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则df.loc[[‘a’,‘d’],[‘A’,‘D’]]
1.2 iloc 基于行索引和列索引(index,columns) 都是从 0 开始
如果数据的行标签和列标签名字太长或不容易记,则用 iloc 很方便,只需记标签对应的索引即可
#df.iloc[0,0]
#取前两行对应数据df.iloc[0:2,:]
#取前两列对应数据df.iloc[:,0:2]
#取前两行和前两列对应数据df.iloc[0:2,0:2]
#上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,df.iloc[[0,3],[0,3]]
比如要统计’label’这一列各个值出现的次数,
法一:df.loc[:,col_name].value_counts()
法二:df[col_name].value_counts()
dataframe.drop([“a”,“b”,“c”], axis=1)
4、删除列数据del(dataframe[‘G’])
5、增加列数据dataframe[‘G’] = series dataframe[‘G’] = dataframe[‘A’] + 46、对某一列重新赋值
dataframe[‘G’] = 100 指定列所有值均为100
7、对值排序df.sort_values(by=“open”, ascending=False) df.sort_values(by=[‘open’, ‘high’]) by:指定排序参考的键,单个键或者多个键进行排序,ascending:默认True升序,False降序8、对索引排序
dataframe.sort_index() ascending:默认True升序,False降序9、获取列数据
(1)dataframe[‘A’] <=> dataframe.A #新series 通过列索引获取列数据 (2)dataframe[[‘A’]] #新Dataframe 只有一列,双层中括号 (3)dataframe[[‘a’,‘c’]] #新Dataframe 多列,双层中括号,不是连续索引10、直接获取某一个值
dataframe[‘A’] [‘2018-02-27’] #对应位置的值 直接使用行列索引名字的方式(先列后行)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)