Python—padas(DataFrame)的常用 *** 作_IT百科

我们先说一下DataFrame是什么：

1、DataFrame是一种数据框结构,相当于是一个矩阵形式，单元格可以存放数值、字符串等，这和excel表很像；

2、DataFrame是有行（index）和列（columns）可以设置的；

有了示例，我们就能明白创建时需要传入数据，指定index（行索引名）和columns（列名）；

在我们需要将单个元素的字典直接转为DataFrame时，程序会报错，需要适当做些转换，指定行索引或者列索引才行；

在增加列的时候我们用到了一个索引loc，后面我们再详细对loc进行说明，此处先知道可以这样使用。

文本字符串数据处理之前，一定要先转为字符（.str）再进行处理

loc 和 iloc如果容易记混，你就取巧记忆，index是索引

所以iloc则是依据位置索引进行取数，没有i的则是按照名称进行提取数据

原谅我很懒，比较喜欢这样框架式的笔记，所以文字就会比较少(#^.^#)！！！

在dataframe中根据一定的条件，得到符合要求的某行元素所在的位置。

代码如下所示：

[python] view plain copy

df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},

index=[10,20,30,40,50])

print(df)

a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()

print(a)

df如下所示，以上通过选取“BoolCol”取值为3且“attr”取值为22的行，得到该行在df中的位置

注意：返回的位置为index列表，根据index的不同而不同，这点易于数组中默认的下标。

[python] view plain copy

BoolCol attr

10 1 22

20 2 33

30 3 22

40 3 44

50 4 66

[30]

欢迎分享，转载请注明来源：内存溢出

Python—padas(DataFrame)的常用 *** 作