import os
data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')
a=data.columns
df_empty=pd.DataFrame(columns=a)
for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):
for filename in filenames:
#print(os.path.join(parents,filename))
data = pd.read_excel(os.path.join(parents,filename))
df_empty=df_empty.append(data,ignore_index=True)
df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')
注意中文写入,os.walk会返回3个参数,分别是路径,目录list,文件list,取第一个和最后一个,最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe,columns中填写行标
python同时读取数据库文件和电脑文件夹文件可以使用python的os模块和sqlite3模块来实现,具体实现步骤如下:
1. 首先,使用python的os模块来获取电脑文件夹中的文件列表,如果文件夹中有子文件夹,可以使用os.walk()函数来获取文件夹中的文件列表;
2. 然后,使用sqlite3模块来连接数据库文件,并使用sql语句来查询数据库中的数据;
3. 最后,将查询出来的数据和文件夹中的文件列表进行合并,得到最终的数据。
#!/usr/bin/env python3.6from pathlib import Path
def read_all_txt(dirname):
ss = []
for p in Path(dirname).rglob('*.txt'):
ss.append(p.read_text())
return ss
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)