Python迭代器切片 *** 作_java

1、如何对迭代器做切片 *** 作？

实际案例：

有某个文本文件，我们想读取其中某范围的内容，如100～300行之间的内容，python中文本文件是可迭代对象，我们是否可以使用类似列表切片的方式得到一个100～300行文件内容的生成器？

f=open('/var/log/dmesg', 'rb')

f[100:300] # 可以么？

解决方案：

使用标准库中的itertools.islice，它能返回一个迭代对象切片的生成器。

注：为什么是迭代对象切片的生成器，因为islice会消耗迭代对象中元素有点类似生成器。

2、代码演示

（1）文本迭代简单介绍

# 查看Linux下kernel信息，cat -n /var/log/dmesg
# 文本迭代：
f = open('/var/log/system.log')
# readlines()可以将文件的每一行读到一个列表当中，然后使用切片
lines = f.readlines()
print(lines[200:201])
'''
但是也存在一个问题readlines()方法会一次性的把整个文件
全部导入到内存当中，如果文件很小没问题，但是日志文件一般都很大
一次性导入可能导致内存不足。
'''
# 因为使用readlines文件指针已经到了文件尾部
# 使用seek()方法使文件指针返回文件头部
f.seek(0)
# 读取文件最好方式还是使用迭代
for line in f:
    print(line)

（2）实现迭代对象切片 *** 作

from itertools import islice
'''
可以使用help(islice)查看silica使用介绍：
    islice(iterable, stop) --> islice object
    islice(iterable, start, stop[, step]) --> islice object
    示例：
        情况1：查看200行到210行内容，slice(f, 200, 210)
        情况2：只查看前200行，islice(f, 200)，只有一个参数表示结尾值
        情况3：只查看200行到末尾，islice(f, 200, None)
    注意：islice不支持负引索，因为在没读完整个文件是不知道文件是多少行的。
'''

f = open('/var/log/system.log')
# 返回一个生成器对象，通过生成器对象，可以设置范围start到end行
islice(f, 200, 210)
# 查看200行到210行内容
for line in islice(f, 200, 210):
    print(line)
'''
需要注意的是silice()方法会消耗迭代器对象，每次使用islice要重新申请对象
'''
l = range(20)
print(list(l))
t = iter(l)
# t是经过迭代的，直到遇到起始值5，5之前的都被消耗了
for x in islice(t, 5, 10):
    print(x, end=" ")
print()
# 再次迭代t，发现输出是从10开始一直到最后，所以每次使用islice要重新申请对象
for x in t:
    print(x, end=" ")

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/langs/792722.html

Python迭代器切片 *** 作

发表评论

评论列表（0条）