当您使用读取文件时
readlines(),生成的列表元素确实具有尾随换行符。这很可能就是您比预期少匹配的原因。
而不是写
for x in list:
写
for x in (s.strip() for s in list):
这将从中的字符串中删除前导和尾随空格
list。因此,它从字符串中删除结尾的换行符。
为了整合您的程序,您可以执行以下 *** 作:
with open('c:/tmp/textfile.TXT') as f: haystack = f.read()if not haystack: sys.exit("Could not read haystack data:-(")with open('c:/tmp/list.txt') as f: for needle in (line.strip() for line in f): if needle in haystack: print(needle, ',one_sentence') else: print(needle, ',another_sentence')
我不想做出太大的改变。最重要的区别是我在这里通过
with语句使用上下文管理器。它可以确保为您正确处理文件(主要是关闭文件)。同样,使用生成器表达式动态删除“
needle”行。上述方法逐行读取并处理针文件,而不是一次将整个文件加载到内存中。当然,这仅对大文件有所不同。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)