f=open("文本文件名")
n=int(raw_input("输入输出的行数:"))
line=f.readline()
while line:
if s in line:
print line
for i in range(n):
line=f.readline()
if line:
print line
else:
break
if not line:break
line=f.readline()
希望你能提供测试用便例,还有tgt_file也是多个句子吗?句子是按行来分还是按标点符号等等。提供一个简单的思路,把tgt_file读到一个数组里,依次读src_file,再建一个字典{},以src_file为key,读一行对比一下是否存在于tgt_file读出的那个数组,如果存在则在字典相应key的值加1,再用临时变量统计哪个文件出现最多,最后读完所以文件,输出字典内容,和最高多是哪个文件。
import reyourfile = "a.txt"
yourtarget = "xxx"
with open(yourfile,"r") as fi:
for line in fi:
if line.strip():
tmp = re.split("\s+",line.strip())
if tmp[0] == yourtarget:
print("|"+"|".join(tmp)+"|")
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)