import pandas as pd data = pd.read_excel('123.xls','Sheet1',index_col=0) data.to_csv('data.csv',encoding='utf-8')将Excel文件转为csv文件的python脚本
#!/usr/bin/env python __author__ = "lrtao2010" ''' Excel文件转csv文件脚本 需要将该脚本直接放到要转换的Excel文件同级目录下 支持xlsx 和 xls 格式 在同级目录下生成名为excel_to_csv.csv 的文件,采用UTF-8编码 ''' import xlrd import csv import os #生成的csv文件名 csv_file_name = 'excel_to_csv.csv' def get_excel_list(): #获取Excel文件列表 excel_file_list = [] file_list = os.listdir(os.getcwd()) for file_name in file_list: if file_name.endswith('xlsx') or file_name.endswith('xls'): excel_file_list.append(file_name) return excel_file_list def get_excel_header(excel_name_for_header): #获取表头,并将表头全部变为小写 workbook = xlrd.open_workbook(excel_name_for_header) table = workbook.sheet_by_index(0) #row_value = table.row_values(0) row_value = [i.lower() for i in table.row_values(0)] return row_value def read_excel(excel_name): #读取Excel文件每一行内容到一个列表中 workbook = xlrd.open_workbook(excel_name) table = workbook.sheet_by_index(0) #读取第一个sheet nrows = table.nrows ncols = table.ncols # 跳过表头,从第一行数据开始读 for rows_read in range(1,nrows): #每行的所有单元格内容组成一个列表 row_value = [] for cols_read in range(ncols): #获取单元格数据类型 ctype = table.cell(rows_read, cols_read).ctype #获取单元格数据 nu_str = table.cell(rows_read, cols_read).value #判断返回类型 # 0 empty,1 string, 2 number(都是浮点), 3 date, 4 boolean, 5 error #是2(浮点数)的要改为int if ctype == 2: nu_str = int(nu_str) row_value.append(nu_str) yield row_value def xlsx_to_csv(csv_file_name,row_value): #生成csv文件 with open(csv_file_name, 'a', encoding='utf-8',newline='') as f: #newline=''不加会多空行 write = csv.writer(f) write.writerow(row_value) if __name__ == '__main__': #获取Excel列表 excel_list = get_excel_list() #获取Excel表头并生成csv文件标题 xlsx_to_csv(csv_file_name,get_excel_header(excel_list[0])) #生成csv数据内容 for excel_name in excel_list: for row_value in read_excel(excel_name): xlsx_to_csv(csv_file_name,row_value) print('Excel文件转csv文件结束 ')
以上就是2种实例方法,感谢大家的阅读和对考高分网的支持。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)