python一次性读取文件夹中的所有excel文件

python一次性读取文件夹中的所有excel文件,第1张

import pandas as pd

import os

data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')

a=data.columns

df_empty=pd.DataFrame(columns=a)

for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):

    for filename in filenames:

        #print(os.path.join(parents,filename))

        data = pd.read_excel(os.path.join(parents,filename))

        df_empty=df_empty.append(data,ignore_index=True) 

df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')

注意中文写乎辩贺入,os.walk会返回3个参数,分别是路径,目录list,文件list,取第一灶饥个和最后一个,最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe,岁派columns中填写行标

在说os.walk前,我们先在ipython3中help一下,打印如下

os.walk返回一个生成器,每次遍历返回的对象是一个元组,元组中包含三个元素:

dirpath:当前遍历的文件夹的路径渗帆,类型为字顷喊者符串;

dirname:当前遍历的文件夹下的子文件夹的名字,类型为列表;

filenames:当前遍历的文件夹下的文件的名字,类型为列表;

创建一个包含子文件夹和文件的walk文件夹,通过终端tree看一下目录结构:

我们通过for循环遍历os.walk()的返回结雀薯果

运行结果如下:

使用os.walk()获取文件夹下的文件大小:

读镇渣文本文件

input = open('data', 'r')

#第二个参数默认为r

input = open('data')

读冲旅带二进制文件

input = open('data', 'rb')

读取所有内容

file_object = open('thefile.txt')

try:

all_the_text = file_object.read( )

finally:

file_object.close( )

读固定字节

file_object = open('abinfile', 'rb')

try:

while True:

chunk = file_object.read(100)

if not chunk:

break

do_something_with(chunk)

finally:

file_object.close( )

读每行

list_of_all_the_lines = file_object.readlines( )

如果文件是文本文件,还可以直接遍历文件对象散芦获取每行:

for line in file_object:

process line


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12298913.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存