【Python】os.walk的使用及获取文件夹下所有文件的大小_教程

在说os.walk前，我们先在ipython3中help一下，打印如下

os.walk返回一个生成器，每次遍历返回的对象是一个元组，元组中包含三个元素：

dirpath:当前遍历的文件夹的路径渗帆，类型为字顷喊者符串；

dirname:当前遍历的文件夹下的子文件夹的名字，类型为列表；

filenames:当前遍历的文件夹下的文件的名字，类型为列表；

创建一个包含子文件夹和文件的walk文件夹，通过终端tree看一下目录结构：

我们通过for循环遍历os.walk()的返回结雀薯果

运行结果如下：

使用os.walk()获取文件夹下的文件大小：

import os

import os.path

rootdir = “d:\data” # 指明被遍历的文件夹

for parent,dirnames,filenames in os.walk(rootdir):#三个参数：分哗返别返胡段回1.父目录 2.所有文件夹名字（不含路径） 3.所有文件名字

for dirname in dirnames: #输出文件夹信息

print "parent is:" + parent

print "dirname is:" + dirname

for filename in filenames:#输出文件信息

print "parent is:" + parent

print "filename is:" + filename

print "the full name of the file is:"乱做饥 + os.path.join(parent,filename) #输出文件路径信息

import pandas as pd

import os

data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')

a=data.columns

df_empty=pd.DataFrame(columns=a)

for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):

for filename in filenames:

#print(os.path.join(parents,filename))

data = pd.read_excel(os.path.join(parents,filename))

df_empty=df_empty.append(data,ignore_index=True)

df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')

注意中文写乎辩贺入，os.walk会返回3个参数，分别是路径，目录list，文件list，取第一灶饥个和最后一个，最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe，岁派columns中填写行标

欢迎分享，转载请注明来源：内存溢出

【Python】os.walk的使用及获取文件夹下所有文件的大小