小予教你 用python 玩转MysqL
爬虫采集下来的数据除了存储在文本文件、excel之外,还可以存储在数据集,如:MysqL,redis,mongodb等,今天辰哥就来教大家如何使用Python连接MysqL,并结合爬虫为大家讲解。
前提:这里默认大家已经安装好MysqL。
01 MysqL简介MysqL是关系型数据库,支持大型的数据库,可以处理拥有上千万条记录的大型数据库。通过爬虫采集的数据集存储到MysqL后,可以借助MysqL的关联查询将相关的数据一步取出。具体的作用这里就不赘述了,下面开始进入实际 *** 作。
1.安装pyMysqL通过下面这个命令进行安装
pip install pyMysqL
pyMysqL库:python3链接MysqL
备注:
ps:MysqLdb只适用于python2.x
python3不支持MysqLdb,取而代之的是pyMysqL
运行会报:importError:No module named 'MysqLdb'
2.python连接MysqLimport pyMysqL as pmq
localhost是本机IP,这里用localhost表示是当前本机,否则将localhost改为对应的数据库ip。
root是数据库用户名,123456是数据库密码,python_chenge是数据库名。
图上的数据库python_chenge已经建立好(建好之后,才能用上面代码去连接),建好之后,当前是没有表的,现在开始用Python进行建表,插入、查询,修改,删除等 *** 作(结合爬虫去讲解)
02 建表在存储之前,先通过python创建表,字段有四个(一个主键+电影名称,链接,评分)
# 创建 movIE 表
创建表movIE,字段分别为(ID ,Title ,url ,rate ),CHaraCTER SET utf8 ColLATE utf8_general_ci是字符串编码设置为utf8格式
ID是主键primary key,int类型,auto_INCREMENT自增,非空not null
Title,url 是字符串类型varchar(100),同样非空
评分rate 是带小数的数字,所以是float,同样非空
03 插入数据爬虫已经采集到数据,python已经建好表,接着可以将采集的数据插入到数据库,这里介绍两种方式
### 插入数据
ID是自增的,所以不需要在传值进去。
定义好插入数据库方法后,开始往数据库进行存储
for i in Json_data['subjects']:
04 查询1.查询所有查询表中所有数据
# 查询
2.查询指定的数据比如查询标题为:唐人街3这一条数据的所有字段
#查询单条
05 更新修改更新数据,还是以上面:唐人街3为例,ID为7,将唐人街3评分从5.5改为6
### 更新
同时看一下数据库
06 删除同样还是以唐人街为例,其ID为7,删除的话咱们可以更新ID去删除
def delete(ID):
删除之后,就没有第7条数据了,说明删除成功
总结以上是内存溢出为你收集整理的pytho 玩转Mysql全部内容,希望文章能够帮你解决pytho 玩转Mysql所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)