python爬虫数据存到非本地mysql

python爬虫数据存到非本地mysql,第1张

pymysql 基本使用 八个步骤以及案例分析

一导入pymysql模块

导入pymysql之前需要先安装pymysql模块

方法一:直接在pycharm编译器里面输入 pip install pymysql

方法二:win+r --> 输入cmd -->在里面输入pip install pymysql

ps:在cmd中输入pip list后回车 可以找到安装的pymysql就表示安装成功了

1

2

3

4

5

6

1

2

3

4

5

6

在pycharm编译器中导入

import pymysql

1

2

1

2

二获取到database的链接对象

coon = pymysqlconnect(host='127001', user='root', password='123456', database='pymysql_test')

1

1

user:是你的数据库用户名

password:数据库密码

database:你已经创建好的数据库

1

2

3

1

2

3

三创建数据表的方法

cursorexecute(

'''create table if not exists pets(id int primary key auto_increment,

src varchar(50),

skill varchar(100)''')

1

2

3

4

1

2

3

4

四获取执行sql语句的光标对象

cousor = cooncousor()

1

1

五定义要执行的sql语句

1sql的增加数据的方法

sql = '''insert into test_mysql(id,src,skill) values(%d,%s,%s)'''

1

1

ps: test_mysql 是你连接到的数据库中的一张表

id,src,skill 这个是你创建表时所定义的字段关键字

%d,%s,%s 这个要根据你创建的字段关键字的类型而定,记住要一一对应

1

2

3

1

2

3

2sql的删除数据的方法

sql_1 = '''delete from test_mysql where src=%s;'''

1

1

3sql的修改数据方法

sql_2 = '''update test_mysql set src=%s where skill=%s;'

1

1

4sql的查询方法

sql_3 = '''select from test_mysql where skill = %s'''

1

1

六通过光标对象执行sql语句

1执行增加数据的sql语句

cousorexecute(sql, [2, ' = '>

增加一条数据

import pymysql

 

 #返回Connection对象

 #host="localhost"

 con = pymysqlconnect(host="1921683128",

                  port=3306,user="atguigu",

                  password="atguigu",

                  db="atguigudb",

                  charset="utf8")

 #返回cursor对象

 cursor = concursor()

 #SQL语言-SQL语句

 sql = "insert into students(name) value('李四')"

 #插入数据

 cursorexecute(sql)

 #提交数据,没有提交就没有数据

 concommit()

 #关闭释放资源

 cursorclose()

 #关闭资源

 conclose()

修改数据

import pymysql

 #修改任意一条数据

 

 #返回Connection对象

 conn = pymysqlconnect(

    host="1921683128",

    db="atguigudb",

    port=3306,

    user="atguigu",

    password="atguigu",

    charset="utf8"

 )

 cursor = conncursor()

 sql = "update students set name='郭靖' where id = 1"

 count = cursorexecute(sql)

 print("count=",count)

 #提交正常数据物理上修改了

 conncommit()

 cursorclose()

 connclose()

删除数据

import pymysql

 #修改任意一条数据

 

 #返回Connection对象

 conn = pymysqlconnect(

    host="1921683128",

    db="atguigudb",

    port=3306,

    user="atguigu",

    password="atguigu",

    charset="utf8"

 )

 cursor = conncursor()

 sql = "delete from students where id =20"

 count = cursorexecute(sql)

 print("count=",count)

 conncommit()

 cursorclose()

 connclose()

查询一条数据

import pymysql

 try:

    conn=pymysqlconnect(

       host='1921683128',

       port=3306,

       db='atguigudb',

       user='atguigu',

       passwd='atguigu',

       charset='utf8'

    )

    cursor=conncursor()

    cursorexecute('select  from students where id = 3')

    #返回满足这个条件的这个数据,如果有多条返回第一条,并且封装元组中

    result = cursorfetchone()

    print(result)

    for i in result:

       print(i)

    cursorclose()

    connclose()

 except Exception as e:

    print(emessage)

查询多条数据

import pymysql

 try:

    conn=pymysqlconnect(

       host='1921683128',

       port=3306,

       db='atguigudb',

       user='atguigu',

       passwd='atguigu',

       charset='utf8'

    )

    cursor=conncursor()

    cursorexecute('select  from students')

    #返回元组,如果多条数据,元组里面嵌套元组

    result = cursorfetchall()

    print(result)

    for i in result:

       print(i)

    conncommit()

    cursorclose()

    connclose()

 except Exception as e:

    print(emessage)

读取mysql数据,填写数据到excel

from pyexcel_xls import save_data

from pyexcel_xls import get_data

from collections import OrderedDict

import mysqlconnector

#和数据库建立连接

cnx =mysqlconnectorconnect(user='root', password='',  

                              host='127001',  

                              database='test')

#查询语句

sql = "select my_name,my_value from tbl_members "

#执行查询

cursorexecute(sql)

#获得查询结果

result = cursorfetchall()

cursorclose()

cnxclose()

#打开预定义表头文件

xls_header= get_data("d:/xhxls")

#获得表头数据

xh = xls_headerpop("Sheet1")

#拼接整表数据

xd = OrderedDict()

xdupdate({"Sheet 1":xh+result})

#保存到另一个文件中

save_data("d:/xdxls",xd)

python34连接mysql的方法是通过pymysql实现的。

1、导入pymysql,编写驱动代码如下:

__author__ = 'pieryon'

#导入pymysql的包

import pymysql

try:

#获取一个数据库连接,注意如果是UTF-8类型的,需要指定数据库

conn=pymysqlconnect(host='localhost',user='root',passwd='qin',db='person',port=3306,charset='utf8')

cur=conncursor()#获取一个游标

curexecute('select from person')

data=curfetchall()

for d in data :

#注意int类型需要使用str函数转义

print("ID: "+str(d[0])+' 名字: '+d[1]+" 性别: "+d[2])

curclose()#关闭游标

connclose()#释放数据库资源

except Exception :print("发生异常")

2、测试结果如下:

D:\python\pythonexe D:/pythonide/pythonprojectworkspace/python/mysqlpy

ID: 1 名字: 秦天 性别: 男

ID: 2 名字: 王晶 性别: 女

Process finished with exit code 0

MySQL 的 Binlog 记录着 MySQL 数据库的所有变更信息,了解 Binlog 的结构可以帮助我们解析Binlog,甚至对 Binlog 进行一些修改,或者说是“篡改”,例如实现类似于 Oracle 的 flashback 的功能,恢复误删除的记录,把 update 的记录再还原回去等。本文将带您探讨一下这些神奇功能的实现,您会发现比您想象地要简单得多。本文指的 Binlog 是 ROW 模式的 Binlog,这也是 MySQL 8 里的默认模式,STATEMENT 模式因为使用中有很多限制,现在用得越来越少了。

Binlog 由事件(event)组成,请注意是事件(event)不是事务(transaction),一个事务可以包含多个事件。事件描述对数据库的修改内容。

现在我们已经了解了 Binlog 的结构,我们可以试着修改 Binlog 里的数据。例如前面举例的 Binlog 删除了一条记录,我们可以试着把这条记录恢复,Binlog 里面有个删除行(DELETE_ROWS_EVENT)的事件,就是这个事件删除了记录,这个事件和写行(WRITE_ROWS_EVENT)的事件的数据结构是完全一样的,只是删除行事件的类型是 32,写行事件的类型是 30,我们把对应的 Binlog 位置的 32 改成 30 即可把已经删除的记录再插入回去。从前面的 “show binlog events” 里面可看到这个 DELETE_ROWS_EVENT 是从位置 378 开始的,这里的位置就是 Binlog 文件的实际位置(以字节为单位)。从事件(event)的结构里面可以看到 type_code 是在 event 的第 5 个字节,我们写个 Python 小程序把把第383(378+5=383)字节改成 30 即可。当然您也可以用二进制编辑工具来改。

找出 Binlog 中的大事务

由于 ROW 模式的 Binlog 是每一个变更都记录一条日志,因此一个简单的 SQL,在 Binlog 里可能会产生一个巨无霸的事务,例如一个不带 where 的 update 或 delete 语句,修改了全表里面的所有记录,每条记录都在 Binlog 里面记录一次,结果是一个巨大的事务记录。这样的大事务经常是产生麻烦的根源。我的一个客户有一次向我抱怨,一个 Binlog 前滚,滚了两天也没有动静,我把那个 Binlog 解析了一下,发现里面有个事务产生了 14G 的记录,修改了 66 万条记录!下面是一个简单的找出 Binlog 中大事务的 Python 小程序,我们知道用 mysqlbinlog 解析的 Binlog,每个事务都是以 BEGIN 开头,以 COMMIT 结束。我们找出 BENGIN 前面的 “# at” 的位置,检查 COMMIT 后面的 “# at” 位置,这两个位置相减即可计算出这个事务的大小,下面是这个 Python 程序的例子。

切割 Binlog 中的大事务

对于大的事务,MySQL 会把它分解成多个事件(注意一个是事务 TRANSACTION,另一个是事件 EVENT),事件的大小由参数 binlog-row-event-max-size 决定,这个参数默认是 8K。因此我们可以把若干个事件切割成一个单独的略小的事务

ROW 模式下,即使我们只更新了一条记录的其中某个字段,也会记录每个字段变更前后的值,这个行为是 binlog_row_image 参数控制的,这个参数有 3 个值,默认为 FULL,也就是记录列的所有修改,即使字段没有发生变更也会记录。这样我们就可以实现类似 Oracle 的 flashback 的功能,我个人估计 MySQL 未来的版本从可能会基于 Binlog 推出这样的功能。

了解了 Binlog 的结构,再加上 Python 这把瑞士军刀,我们还可以实现很多功能,例如我们可以统计哪个表被修改地最多?我们还可以把 Binlog 切割成一段一段的,然后再重组,可以灵活地进行 MySQL 数据库的修改和迁移等工作。

以上就是关于python爬虫数据存到非本地mysql全部的内容,包括:python爬虫数据存到非本地mysql、python如何把txt中的文本数据导入mysql中、python使用数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9796114.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存