可伸缩的解决方案，其中包含pandas中的字符串列表

出现内部错误 • 2022-12-16 • 随笔 • 阅读 18

可伸缩的解决方案，其中包含pandas中的字符串列表

对于可扩展的解决方案，请执行以下 *** 作-

索引0次列，不使用

df1[0]

（因为这可能被认为不明确）。最好使用

loc

或

iloc

（请参见下文）。

words = ["words", "to", "remove"]mask = df1.iloc[:, 0].str.contains(r'b(?:{})b'.format('|'.join(words)))df1 = df1[~mask]

注意：如果

words

是系列，这也将起作用。

另外，如果您的第0列仅是单词（而不是句子）的列，则可以使用

df.isin

，这应该更快-

df1 = df1[~df1.iloc[:, 0].isin(words)]

欢迎分享，转载请注明来源：内存溢出

单词解决方案下文伸缩字符串

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-15

下一篇 2022-12-15

登录后才能评论