df1=df[df['列标签']条件] #条件为条件表达式。其中df['列标签']条件,返回一个bool值,df1=df[bool]把DataFrame中bool值为Ture的符合筛选条件的筛选出来。
例如:df1=df[df['工作者']>100]
它的工作原理是:
bool=[df['工作者']>100
df1=df[bool]
2、同时满足多个条件的筛选
多个df['列标签']条件,返回多个bool值
bools=bool1&bool2&bool3 #多个bool值取逻辑与
df[bools]
3、按含有字符的条件筛选某列
df['列索引'] #数据类型为dtype:object,需要转换成字符串才能分析。
df['列索引'] .str #可以把它转换成str类型。
bool=df['列索引'] .str.contains('字符串')#判断是否含有该字符串。
df[bool]筛选出含有要求字符串的DataFrame。
pandas 里调用属性的方式有两种,分别是df4.名称
df4["名称"]
python 单个等于号是赋值,应该用双等于号
df4["名称"] == "A"
又等于号只能筛选单个值,筛选列表时要用方法 isin
df4["名称"].isin(["A","B","C","D"])
所以正确的代码为
df5 = df4[df4["名称"].isin(["A","B","C","D"])]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)