对于可扩展的解决方案,请执行以下 *** 作-
- 通过正则表达式或管道连接单词的内容
|
- 传递给
str.contains
- 使用结果进行过滤
df1
索引0次列,不使用
df1[0](因为这可能被认为不明确)。最好使用
loc或
iloc(请参见下文)。
words = ["words", "to", "remove"]mask = df1.iloc[:, 0].str.contains(r'b(?:{})b'.format('|'.join(words)))df1 = df1[~mask]
注意:如果
words是系列,这也将起作用。
另外,如果您的第0列仅是单词(而不是句子)的列,则可以使用
df.isin,这应该更快-
df1 = df1[~df1.iloc[:, 0].isin(words)]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)