pandas 列的 *** 作

pandas 列的 *** 作,第1张

pandas 列的 *** 作 padas对列的 *** 作 1、loc和iloc

loc适用于索引中的标签
iloc在索引中的位置上起作用。
##1.1 loc基于行标签和列标签(x_label、y_label)进行索引
.loc先行后列,中间用逗号(,)分割,
#取 a 和 A 对应的数据df.loc[‘a’,‘A’]
#取前两行对应数据df.loc[‘a’:‘b’,:]
#取前两列对应数据df.loc[:,‘A’:‘B’]
#取前两行和前两列对应数据df.loc[‘a’:‘b’,‘A’:‘B’]
#上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,则df.loc[[‘a’,‘d’],[‘A’,‘D’]]

1.2 iloc 基于行索引和列索引(index,columns) 都是从 0 开始
如果数据的行标签和列标签名字太长或不容易记,则用 iloc 很方便,只需记标签对应的索引即可
#df.iloc[0,0]
#取前两行对应数据df.iloc[0:2,:]
#取前两列对应数据df.iloc[:,0:2]
#取前两行和前两列对应数据df.iloc[0:2,0:2]
#上面的例子取的都是连续的行和列,若取第一行和第四行、第一列和第四列对应的数据,df.iloc[[0,3],[0,3]]

2、统计某一列中各个值的出现次数

比如要统计’label’这一列各个值出现的次数,
法一:df.loc[:,col_name].value_counts()
法二:df[col_name].value_counts()

3、删除若干列

dataframe.drop([“a”,“b”,“c”], axis=1)

4、删除列数据

del(dataframe[‘G’])

5、增加列数据
			dataframe[‘G’] = series
          dataframe[‘G’] = dataframe[‘A’] + 4
6、对某一列重新赋值

dataframe[‘G’] = 100 指定列所有值均为100

7、对值排序
df.sort_values(by=“open”, ascending=False)
df.sort_values(by=[‘open’, ‘high’]) 
by:指定排序参考的键,单个键或者多个键进行排序,ascending:默认True升序,False降序
8、对索引排序
dataframe.sort_index() ascending:默认True升序,False降序
9、获取列数据
(1)dataframe[‘A’] <=> dataframe.A  #新series 通过列索引获取列数据
(2)dataframe[[‘A’]]                #新Dataframe 只有一列,双层中括号
(3)dataframe[[‘a’,‘c’]]            #新Dataframe 多列,双层中括号,不是连续索引
10、直接获取某一个值
dataframe[‘A’] [‘2018-02-27’] #对应位置的值	直接使用行列索引名字的方式(先列后行)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5521592.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-13
下一篇 2022-12-13

发表评论

登录后才能评论

评论列表(0条)

保存