Python迭代器切片 *** 作

Python迭代器切片 *** 作,第1张

1、如何对迭代器做切片 *** 作?

        实际案例:

                有某个文本文件,我们想读取其中某范围的内容,如100~300行之间的内容,python中文本文件是可迭代对象,我们是否可以使用类似列表切片的方式得到一个100~300行文件内容的生成器?

                f=open('/var/log/dmesg', 'rb')

                f[100:300] # 可以么?

        解决方案:

                使用标准库中的itertools.islice,它能返回一个迭代对象切片的生成器。

        注:为什么是迭代对象切片的生成器,因为islice会消耗迭代对象中元素有点类似生成器。

2、代码演示

(1)文本迭代简单介绍

# 查看Linux下kernel信息,cat -n /var/log/dmesg
# 文本迭代:
f = open('/var/log/system.log')
# readlines()可以将文件的每一行读到一个列表当中,然后使用切片
lines = f.readlines()
print(lines[200:201])
'''
但是也存在一个问题readlines()方法会一次性的把整个文件
全部导入到内存当中,如果文件很小没问题,但是日志文件一般都很大
一次性导入可能导致内存不足。
'''
# 因为使用readlines文件指针已经到了文件尾部
# 使用seek()方法使文件指针返回文件头部
f.seek(0)
# 读取文件最好方式还是使用迭代
for line in f:
    print(line)

(2)实现迭代对象切片 *** 作
 

from itertools import islice
'''
可以使用help(islice)查看silica使用介绍:
    islice(iterable, stop) --> islice object
    islice(iterable, start, stop[, step]) --> islice object
    示例:
        情况1:查看200行到210行内容,slice(f, 200, 210)
        情况2:只查看前200行,islice(f, 200),只有一个参数表示结尾值
        情况3:只查看200行到末尾,islice(f, 200, None)
    注意:islice不支持负引索,因为在没读完整个文件是不知道文件是多少行的。
'''

f = open('/var/log/system.log')
# 返回一个生成器对象,通过生成器对象,可以设置范围start到end行
islice(f, 200, 210)
# 查看200行到210行内容
for line in islice(f, 200, 210):
    print(line)
'''
需要注意的是silice()方法会消耗迭代器对象,每次使用islice要重新申请对象
'''
l = range(20)
print(list(l))
t = iter(l)
# t是经过迭代的,直到遇到起始值5,5之前的都被消耗了
for x in islice(t, 5, 10):
    print(x, end=" ")
print()
# 再次迭代t,发现输出是从10开始一直到最后,所以每次使用islice要重新申请对象
for x in t:
    print(x, end=" ")

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/792722.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-05
下一篇 2022-05-05

发表评论

登录后才能评论

评论列表(0条)

保存