PythonPandas:从列表中的字符串匹配中删除数据框中的行

PythonPandas:从列表中的字符串匹配中删除数据框中的行,第1张

Python / Pandas:从列表中的字符串匹配中删除数据框中的行

使用

isin
并传递您要搜索的字词列表,然后可以使用取反布尔掩码
~
,这将过滤掉这些行:

In [6]:to_drop = ['Clerk', 'Bagger']df[~df['title'].isin(to_drop)]Out[6]:  fName  lName  email title0  John  Smith  jsmith@gmail.com   CEO

另一种方法是加入术语,使其成为正则表达式并使用向量化

str.contains

In [8]:df[~df['title'].str.contains('|'.join(to_drop))]Out[8]:  fName  lName  email title0  John  Smith  jsmith@gmail.com   CEO

IMO将作为后处理步骤执行过滤将更加容易,并且可能会更快,因为如果您决定在读取时进行过滤,那么您将迭代增长效率不高的数据帧。

另外,您也可以分块读取csv,过滤掉不需要的行,并将块附加到输出csv



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5666870.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存