1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;
2、DataFrame是有 行(index)和 列(columns)可以设置的;
有了示例,我们就能明白创建时需要传入数据,指定index(行索引名)和columns(列名);
在我们需要将单个元素的字典直接转为DataFrame时,程序会报错,需要适当做些转换,指定行索引或者列索引才行;
在增加列的时候我们用到了一个索引loc,后面我们再详细对loc进行说明,此处先知道可以这样使用。
文本字符串数据处理之前,一定要先转为字符(.str)再进行处理
loc 和 iloc如果容易记混,你就取巧记忆,index是索引
所以iloc则是依据位置索引进行取数,没有i的则是按照名称进行提取数据
原谅我很懒,比较喜欢这样框架式的笔记,所以文字就会比较少(#^.^#)!!!
在dataframe中根据一定的条件,得到符合要求的某行元素所在的位置。
代码如下所示:
[python] view plain copy
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
df如下所示,以上通过选取“BoolCol”取值为3且“attr”取值为22的行,得到该行在df中的位置注意:返回的位置为index列表,根据index的不同而不同,这点易于数组中默认的下标。
[python] view plain copy
BoolCol attr
10 1 22
20 2 33
30 3 22
40 3 44
50 4 66
[30]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)