如何在python中将文本文件拆分为单词?

如何在python中将文本文件拆分为单词?,第1张

如何在python中将文本文件拆分为单词?

没有人建议过发电机,我很惊讶。这是我的处理方式:

def words(stringIterable):    #upcast the argument to an iterator, if it's an iterator already, it stays the same    lineStream = iter(stringIterable)    for line in lineStream: #enumerate the lines        for word in line.split(): #further break them down yield word

现在,这可以在您可能已经在内存中的简单句子列表中使用:

listOfLines = ['hi there', 'how are you']for word in words(listOfLines):    print(word)

但是它在文件上也可以正常工作,而无需读取内存中的整个文件:

with open('words.py', 'r') as myself:    for word in words(myself):        print(word)


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5667415.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存