1 如何用Python导入Excel以及csv数据集

1 如何用Python导入Excel以及csv数据集,第1张

Excel是一个二进制文件,它保存有关工作簿中所有工作表的信息

CSV代表Comma Separated Values 。这是一个纯文本格式,用逗号分隔一系列值

Excel不仅可以存储数据,还可以对数据进行 *** 作

CSV文件只是一个文本文件,它存储数据,但不包含格式,公式,宏等。它也被称为平面文件

Excel是一个电子表格,将文件保存为自己的专有格式,即xls或xlsx

CSV是将表格信息保存为扩展名为.csv的分隔文本文件的格式

保存在excel中的文件不能被文本编辑器打开或编辑

CSV文件可以通过文本编辑器(如记事本)打开或编辑

excel中会有若干个表单,每个表单都会这些属性: 

行数(nrows) 列数(ncols) 名称(name) 索引(number) 

import xlrd //执行 *** 作前需要导入xlrd库 

#读取文件 

excel = xlrd.open_workexcel("文件地址") //这里表格名称为excel,文件的地址可以从文件的属性中看到 

#读取表格表单数量 

sheet_num= excel.nsheets // sheet_num为变量,其值为表格表单数量 

#读取表格表单名称 

sheet_name = excel.sheet_names() // sheet_name为变量,其值为表格表单名称 

#如果想要看到上述两个变量,可以使用print()函数将它们打印出来 

#想要读取某个表单的数据,首先获取表单 excel.sheet_by_index(0) 

//表单索引从0开始,获取第一个表单对象 excel.sheet_by_name('xxx') 

// 获取名为”xxx”的表单对象 excel.sheets() 

// 获取所有的表单对象 获取单元格的内容:使用cell_value 方法 这里有两个参数:行号和列号,用来读取指定的单元格内容。 

第一行的内容是:sheet.row_values(rowx=0) 

第一列的内容是:sheet.col_values(colx=0)

CSV是英文Comma Separate Values(逗号分隔值)的缩写,文档的内容是由 “,” 分隔的一列列的数据构成的。在python数据处理中也经常用到。

import csv //执行 *** 作前需要导入csv库 

#csv读取 

遍历其中数据 csv_file = csv.reader(open(‘文件地址’,’r’)) for x in csv_file print(x)

读取mysql数据,填写数据到excel

from

pyexcel_xls

import

save_datafrom

pyexcel_xls

import

get_datafrom

collections

import

ordereddictimport

mysql.connector

#和数据库建立连接cnx

=mysql.connector.connect(user='root',

password='',

host='127.0.0.1',

database='test')#查询语句sql

=

"select

my_name,my_value

from

tbl_members

"#执行查询cursor.execute(sql)#获得查询结果result

=

cursor.fetchall()

cursor.close()cnx.close()

#打开预定义表头文件xls_header=

get_data("d:/xh.xls")

#获得表头数据xh

=

xls_header.pop("sheet1")

#拼接整表数据xd

=

ordereddict()xd.update({"sheet

1":xh+result})

#保存到另一个文件中save_data("d:/xd.xls",xd

数据库版本:MySQL

Python版本:3.5

之前用想用MySQLdb来着,后来发现py3.5版本不支持,现选择pymysql

现在想将数据库adidas中的表jd_comment读取至python中的DataFrame,方便数据分析处理

import pymysql

import pandas as pd

import numpy as np

try:

conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='adidas', charset='UTF8')

cur = conn.cursor()

cur.execute('select * from jd_comment')

rows = cur.fetchall() #获取元组列表

cur.close()

conn.close()

except pymysql.Error as e:

print('Mysql Error %d: %s' %(e.args[0], e.args[1]))

cols = list(zip(*cur.description)) #可以看到列名(由元组构成)

#将数据库中的数据保存为DataFrame(数据必须是字典或者数组,列表也必须是list或者数组)

adidas = pd.DataFrame(np.array(rows), columns=list(cols[0]))


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9862472.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存