在python中怎么引入数据库_sql

数据库版本：MySQL

Python版本：3.5

之前用想用MySQLdb来着，后来发现py3.5版本不支持，现选择pymysql

现在想将数据库adidas中的表jd_comment读取至python中的DataFrame，方便数据分析处理

import pymysql

import pandas as pd

import numpy as np

try:

conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='adidas', charset='UTF8')

cur = conn.cursor()

cur.execute('select * from jd_comment')

rows = cur.fetchall() #获取元组列表

cur.close()

conn.close()

except pymysql.Error as e:

print('Mysql Error %d: %s' %(e.args[0], e.args[1]))

cols = list(zip(*cur.description)) #可以看到列名(由元组构成)

#将数据库中的数据保存为DataFrame(数据必须是字典或者数组，列表也必须是list或者数组)

adidas = pd.DataFrame(np.array(rows), columns=list(cols[0]))

通过python将大批excel数据导入mysql：

利用Python从EXCEL中读取两列数据存储在LIST中然后连接数据库利用insert语句和LIST 内容结合，导入数据库；然后再从数据库读取表的字段和内容，存放到EXCEL新表中即可。

以下的导入的核心代码：

#按照说明安装即可

import win32com.client as win32

import MySQLdb

app='Excel'

#启动EXCEL程序

xl=win32.gencache.EnsureDispatch('%s.Application' % app)

#打开相应的EXCEL文件

xlbook=win32.Dispatch('Excel.Application').Workbooks.Open('D:\\pyd\\opsdata.xls')

#读取EXCEL工具表，打开要导入数据的表

sh=xlbook.Worksheets('sheet2')

#建立一个空LIST和两个循环参数

dfun=[]

jcount=2

ncount=1

#从第一列开始向下循环，找到为空的那一行返回行数，即为第ncount行为空

for ncount in range(1,65566):

if sh.Cells(ncount,1).Value==None:

break

else:

continue

#print ncount，测试代码，测试ncount值

#EXCEL的数据安排为第一行是字段，第二行开始是数据，故从第2行开始循环，将两列数据合并到一个LIST中

#LIST结构为[('a','b'),('c','d')]

for jcount in range(2,ncount):

dfun.append((sh.Cells(jcount,1).Value,sh.Cells(jcount,2).Value))

#关闭EXCEL程序

#xl.Application.Quit()

#print dfun，测试代码测试dfun的数据

#建立一个空LIST fo用来存放字段，读取EXCEL中第一行的字段存储到fo中

fo=[]

icount=1

for icount in range(1,2):

fo.append((sh.Cells(1,icount).Value,sh.Cells(1,icount+1).Value))

#测试代码，print fo

#打开MYSQL链接

conn=MySQLdb.connect(host='localhost',user='root',passwd='0.789asd',db='python')

#获取游标 *** 作

cursor=conn.cursor()

#建立一个空表

cursor.execute("create table test("+fo[0][0]+" varchar(100),"+fo[0][1]+" varchar(100))")

#利用executemany命令，将LIST，dfun中的数据通过insert语句写入数据库

cursor.executemany("""insert into test values(%s,%s)""" ,dfun)

#确认数据 *** 作，注意如果没有conn.commit()这个命令，数据无法被插入到数据库中

conn.commit()

#执行查询检查结果

count = cursor.execute('select * from test')

print 'has %s record' % count

#重置游标位置

cursor.scroll(0,mode='absolute')

#搜取所有结果

results = cursor.fetchall()

#测试代码，print results

#获取MYSQL里的数据字段

fields = cursor.description

#将字段写入到EXCEL新表的第一行

sh2=xlbook.Worksheets('sheet3')

#清空sheet3

sh2.Cells.Clear

for ifs in range(1,len(fields)+1):

sh2.Cells(1,ifs).Value=fields[ifs-1][0]

#将读取的数据填入到相应的行列中

ics=2

jcs=1

for ics in range(2,len(results)+2):

for jcs in range(1,len(fields)+1):

sh2.Cells(ics,jcs).Value=results[ics-2][jcs-1]

#关闭EXCEL程序

xl.Application.Quit()

#关闭游标和查询链接

cursor.close()

conn.close()

MySQL 的 Binlog 记录着 MySQL 数据库的所有变更信息，了解 Binlog 的结构可以帮助我们解析Binlog，甚至对 Binlog 进行一些修改，或者说是“篡改”，例如实现类似于 Oracle 的 flashback 的功能，恢复误删除的记录，把 update 的记录再还原回去等。本文将带您探讨一下这些神奇功能的实现，您会发现比您想象地要简单得多。本文指的 Binlog 是 ROW 模式的 Binlog，这也是 MySQL 8 里的默认模式，STATEMENT 模式因为使用中有很多限制，现在用得越来越少了。

Binlog 由事件（event）组成，请注意是事件（event）不是事务（transaction），一个事务可以包含多个事件。事件描述对数据库的修改内容。

现在我们已经了解了 Binlog 的结构，我们可以试着修改 Binlog 里的数据。例如前面举例的 Binlog 删除了一条记录，我们可以试着把这条记录恢复，Binlog 里面有个删除行（DELETE_ROWS_EVENT）的事件，就是这个事件删除了记录，这个事件和写行（WRITE_ROWS_EVENT）的事件的数据结构是完全一样的，只是删除行事件的类型是 32，写行事件的类型是 30，我们把对应的 Binlog 位置的 32 改成 30 即可把已经删除的记录再插入回去。从前面的 “show binlog events” 里面可看到这个 DELETE_ROWS_EVENT 是从位置 378 开始的，这里的位置就是 Binlog 文件的实际位置（以字节为单位）。从事件（event）的结构里面可以看到 type_code 是在 event 的第 5 个字节，我们写个 Python 小程序把把第383（378+5=383）字节改成 30 即可。当然您也可以用二进制编辑工具来改。

找出 Binlog 中的大事务

由于 ROW 模式的 Binlog 是每一个变更都记录一条日志，因此一个简单的 SQL，在 Binlog 里可能会产生一个巨无霸的事务，例如一个不带 where 的 update 或 delete 语句，修改了全表里面的所有记录，每条记录都在 Binlog 里面记录一次，结果是一个巨大的事务记录。这样的大事务经常是产生麻烦的根源。我的一个客户有一次向我抱怨，一个 Binlog 前滚，滚了两天也没有动静，我把那个 Binlog 解析了一下，发现里面有个事务产生了 1.4G 的记录，修改了 66 万条记录！下面是一个简单的找出 Binlog 中大事务的 Python 小程序，我们知道用 mysqlbinlog 解析的 Binlog，每个事务都是以 BEGIN 开头，以 COMMIT 结束。我们找出 BENGIN 前面的 “# at” 的位置，检查 COMMIT 后面的 “# at” 位置，这两个位置相减即可计算出这个事务的大小，下面是这个 Python 程序的例子。

切割 Binlog 中的大事务

对于大的事务，MySQL 会把它分解成多个事件（注意一个是事务 TRANSACTION，另一个是事件 EVENT），事件的大小由参数 binlog-row-event-max-size 决定，这个参数默认是 8K。因此我们可以把若干个事件切割成一个单独的略小的事务

ROW 模式下，即使我们只更新了一条记录的其中某个字段，也会记录每个字段变更前后的值，这个行为是 binlog_row_image 参数控制的，这个参数有 3 个值，默认为 FULL，也就是记录列的所有修改，即使字段没有发生变更也会记录。这样我们就可以实现类似 Oracle 的 flashback 的功能，我个人估计 MySQL 未来的版本从可能会基于 Binlog 推出这样的功能。

了解了 Binlog 的结构，再加上 Python 这把瑞士军刀，我们还可以实现很多功能，例如我们可以统计哪个表被修改地最多？我们还可以把 Binlog 切割成一段一段的，然后再重组，可以灵活地进行 MySQL 数据库的修改和迁移等工作。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10810107.html

在python中怎么引入数据库

发表评论

评论列表（0条）