os.walk返回一个生成器,每次遍历返回的对象是一个元组,元组中包含三个元素:
dirpath:当前遍历的文件夹的路径渗帆,类型为字顷喊者符串;
dirname:当前遍历的文件夹下的子文件夹的名字,类型为列表;
filenames:当前遍历的文件夹下的文件的名字,类型为列表;
创建一个包含子文件夹和文件的walk文件夹,通过终端tree看一下目录结构:
我们通过for循环遍历os.walk()的返回结雀薯果
运行结果如下:
使用os.walk()获取文件夹下的文件大小:
import osimport os.path
rootdir = “d:\data” # 指明被遍历的文件夹
for parent,dirnames,filenames in os.walk(rootdir):#三个参数:分哗返别返胡段回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字
for dirname in dirnames: #输出文件夹信息
print "parent is:" + parent
print "dirname is:" + dirname
for filename in filenames:#输出文件信息
print "parent is:" + parent
print "filename is:" + filename
print "the full name of the file is:"乱做饥 + os.path.join(parent,filename) #输出文件路径信息
import pandas as pd
import os
data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')
a=data.columns
df_empty=pd.DataFrame(columns=a)
for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):
for filename in filenames:
#print(os.path.join(parents,filename))
data = pd.read_excel(os.path.join(parents,filename))
df_empty=df_empty.append(data,ignore_index=True)
df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')
注意中文写乎辩贺入,os.walk会返回3个参数,分别是路径,目录list,文件list,取第一灶饥个和最后一个,最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe,岁派columns中填写行标
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)