Python—padas(DataFrame)的常用 *** 作

Python—padas(DataFrame)的常用 *** 作,第1张

我们先说一下DataFrame是什么:

1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;

2、DataFrame是有 行(index)和 列(columns)可以设置的;

有了示例,我们就能明白创建时需要传入数据,指定index(行索引名)和columns(列名);

在我们需要将单个元素的字典直接转为DataFrame时,程序会报错,需要适当做些转换,指定行索引或者列索引才行;

在增加列的时候我们用到了一个索引loc,后面我们再详细对loc进行说明,此处先知道可以这样使用。

文本字符串数据处理之前,一定要先转为字符(.str)再进行处理

loc 和 iloc如果容易记混,你就取巧记忆,index是索引

所以iloc则是依据位置索引进行取数,没有i的则是按照名称进行提取数据

原谅我很懒,比较喜欢这样框架式的笔记,所以文字就会比较少(#^.^#)!!!

在dataframe中根据一定的条件,得到符合要求的某行元素所在的位置。

代码如下所示:

[python] view plain copy

df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},

index=[10,20,30,40,50])

print(df)

a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()

print(a)

df如下所示,以上通过选取“BoolCol”取值为3且“attr”取值为22的行,得到该行在df中的位置

注意:返回的位置为index列表,根据index的不同而不同,这点易于数组中默认的下标。

[python] view plain copy

BoolCol  attr

10        1    22

20        2    33

30        3    22

40        3    44

50        4    66

[30]


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11883435.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-19
下一篇 2023-05-19

发表评论

登录后才能评论

评论列表(0条)

保存