python – 为什么我的glob.glob循环不遍历文件夹中的所有文本文件?

python – 为什么我的glob.glob循环不遍历文件夹中的所有文本文件?,第1张

概述我试图从包含 python 3的文本文档的文件夹中读取.具体来说,这是对LingSpam垃圾邮件数据集的修改.我期待我写的代码返回所有1893个文本文档名称,但是,代码返回前420个文件名.我不明白为什么它没有停止文件名的总数.有任何想法吗? if not os.path.exists('train'): # download data from urllib.request import @H_301_0@ @H_301_0@ 我试图从包含 python 3的文本文档的文件夹中读取.具体来说,这是对lingSpam垃圾邮件数据集的修改.我期待我写的代码返回所有1893个文本文档名称,但是,代码返回前420个文件名.我不明白为什么它没有停止文件名的总数.有任何想法吗?

if not os.path.exists('train'):  # download data  from urllib.request import urlretrIEve  import tarfile  urlretrIEve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz','lingspam.tgz')  tar = tarfile.open('lingspam.tgz')  tar.extractall()  tar.close()abc = []for f in glob.glob("train/*.txt"):  print(f)  abc.append(f)print(len(abc))

我试过更改glob参数但仍然没有成功.

编辑:显然我的代码适用于除我之外的所有人.这是我的output

解决方法 成功!问题是

if not os.path.exists('train'):  # download data

为了检查我的输出,我实际上已经将文件下载到我的计算机上,并且由于该行检查了该文件夹是否存在,并且它确实存在,因此导致了问题.我删除了我的机器上的文件,现在它可以正常工作,但我怀疑是在运行

from urllib.request import urlretrIEve  import tarfile  urlretrIEve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz','lingspam.tgz')  tar = tarfile.open('lingspam.tgz')  tar.extractall()  tar.close()

没有if语句就会有相同的结果.

@H_301_0@ 总结

以上是内存溢出为你收集整理的python – 为什么我的glob.glob循环遍历文件夹中的所有文本文件?全部内容,希望文章能够帮你解决python – 为什么我的glob.glob循环不遍历文件夹中的所有文本文件?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1196077.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存