io模块的文档
with open(fname, 'rb') as fh: first = next(fh).depre() fh.seek(-1024, 2) last = fh.readlines()[-1].depre()
此处的变量值为1024:它表示平均字符串长度。例如,我仅选择1024。如果您估算了平均线长,则可以将该值乘以2。
由于您不知道行长的可能上限,因此显而易见的解决方案是遍历文件:
for line in fh: passlast = line
您无需费心可以使用的二进制标志
open(fname)。
预计 到达时间( ETA)
:由于您有许多文件需要处理,因此您可以使用创建数十个文件的示例,
random.sample然后对它们运行此代码以确定最后一行的长度。先验地获得较大的位置偏移值(假设为1
MB)。这将帮助您估算整个运行的价值。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)