最近接触到数据科学,需要对一些数据表进行分析,观察到代码中一会出现loc一会又出现iloc,下面对两者的用法给出我的一些理解。
1.联系(1) *** 作对象相同:loc和iloc都是对Dataframe类型进行 *** 作;
(2)完成目的相同:二者都是用于选取Dataframe中对应行或列中的元素。
2.区别loc和iloc索引的行列标签类型不同。
iloc使用顺序数字来索引数据,而不能使用字符型的标签来索引数据;注意:这里的顺序数字是指从0开始计数!
loc使用实际设置的索引来索引数据。但行列名为数字时,loc也可以索引数字,但这里的数字不一定从0开始编号,是对应具体行列名的数字!
3.用法下面用代码来讲解两者的用法。
3.1行列全为从0开始顺序编号import pandas as pd import numpy as np a = np.arange(12).reshape(3,4) #将a转化为Dataframe类型 df = pd.Dataframe(a) #展示df df
由于未给df的行列命名,默认从0开始编号,所以这个时候使用loc和iloc结果是一样的。
索引为一个数,默认输出行 print(df.loc[0])#输出第0行元素 print(df.iloc[0])#输出第0行元素
两者输出结果都为:
0 0 1 1 2 2 3 3 Name: 0, dtype: int32
输出结果为df第0行元素,结果中第一列表示列名,第二列表示具体的值。如果只需要输出某一列,输入df.loc[:,0]表示输出第0列。
如果需要输出第0到2列的数据。
#方式1 df.loc[:,0:2]#可把loc理解为遍历字符串类型,0:2则表示标签为0,1,2三列 #方式2 df.iloc[:,0:3]#iloc遍历的数数字,python中0:3对应0,1,和2
输出结果均为:
3.2有一行或列不是从0顺序编号
#把行标签换成其他数字编号 df.index=[2,5,7] df.loc[2]
此时df变为:
输出结果为:
0 0 1 1 2 2 3 3 Name: 2, dtype: int32
输出结果对应的是列标签为“2”所在的行。
我们继续用df.iloc[2]输出结果:
0 8 1 9 2 10 3 11 Name: 7, dtype: int32
可见输出的是第2行的数据。
在这里我们能大概对loc和iloc的用法有了一定的了解。
3.3行或者列为非数字标签#把行标签转化为非数字类型 df.index=['a','b','c'] #输出第a、b行,第0到2列的数据 #方式1 df.loc[['a','b'],0:2]#可把loc理解为遍历字符串类型,0:2则表示标签为0,1,2三列 #方式2 df.iloc[0:2,0:3]#iloc遍历的是数字,0:2表示的是0和1,0:3表示0,1,2。
两者输出结果均为:
3.4 其他用法一般情况下,表的行为从0编号的数字类型,列为具体的字符串类型。行的数字容易确定,列的列名容易确定。
#将行换成0 1 2编号 df.index=[0,1,2] #列标签换成A B C D df.columns=['A','B','C','D'] df.iloc[1]['A']#实现输出第1行第A列的数据
输出结果为4。
如果要输出第1行,第AB列,使用df.iloc[1][['A','B']],这里一定要注意'A','B'是作为一个列表输入的,右侧一共有两个中括号。
输出结果:
A 4 B 5 Name: 1, dtype: int32
df.iloc[1][['A','B']]等价于df.iloc[1,0:2],但是很多情况下我们不知道具体列名对应的数字,所以采用第一种方法可以提高编程效率。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)