python把爬到的数据放到数据库(python爬虫怎么把爬的数据写进文件里)

python把爬到的数据放到数据库(python爬虫怎么把爬的数据写进文件里),第1张

MySQL

是一个关系数据管理系统,由瑞典MySQLAB公司开发,目前属于Oracle旗下产品。MySQL是最流行的关系型数据库管理系统之一,在WEB应用方面,MySQL是最好的RDBMS(RelationalDatabaseManagementSystem,关系数据库管理系统)应用软件。

MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。

MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据库。

:《Python基础教程》

应用环境

与其他的大型数据库例如Oracle、DB2、SQLServer等相比,MySQL自有它的不足之处,但是这丝毫也没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说,MySQL提供的功能已经绰绰有余,而且由于MySQL是开放源码软件,因此可以大大降低总体拥有成本。

MongoDB

是一个基于分布式文件存储的数据库。由C语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。

MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

特点

它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:

面向集合存储,易存储对象类型的数据。

mongodb集群参考

模式自由。

支持动态查询。

支持完全索引,包含内部对象。

支持查询。

支持复制和故障恢复。

使用高效的二进制数据存储,包括大型对象(如视频等)。

自动处理碎片,以支持云计算层次的扩展性。

支持RUBY,PYTHON,JAVA,C,PHP,C#等多种语言。

文件存储格式为BSON(一种JSON的扩展)。

可通过网络访问。

环境软件需求:

1、Python版本:Python 360,anaconda430(64bt)

2、编码格式:-- coding: utf-8 --

valuestartswitch('~') 这个是判断这个字符串是否以“~”开头,如果是就返回True

cursexecute(‘’‘)三个引号 ''' ''' 之间表示是一个字符串,可以换行,单引号和双引号之间只能写成一行。

fields=linesplit(‘^’)意思是将字符串变成列表,按照"^"分开。

两种方法

1、python读取文件后,解析value中的id,存储到list中,再读另一个文件时,去list里判断是否已存在

2、python读取另一个文件后,解析values中的id,脚本直接去数据库判断是否存在

其实数据库可以设计id未主键,这样你直接insert即可,出错的话,数据库会容错

需要使用xlrd和MySQLdb库,可自行百度下载。

#coding:utf-8

import xlrd

import MySQLdb

data=xlrdopen_workbook(r'F:\test\baseParamxls') #读取表格db="测试" #需要 *** 作的数据库

conn= MySQLdbconnect(

host='localhost',

port = 3306,

user='root',

passwd='123456',

charset='utf8'

) #连接mysql

cur=conncursor()

curexecute("drop database if exists "+db)curexecute("create database "+db)

connselect_db(db) #初始化数据库

sheet_names=datasheet_names()

for sheet_name in sheet_names:

sheet=datasheet_by_name(sheet_name)

row_data=sheetrow_values(0)

row_data=' varchar(256) DEFAULT NULL, 'join(row_data)row_data=row_data+' varchar(256) DEFAULT NULL'

curexecute('create table '+sheet_name+'('+row_data+')') #数据库中创建表格ss=''

for index in range(sheetncols):

ss=ss+'%s, '

ss=ssrstrip(', ')

sql="insert "+ sheet_name+ " values(" +ss +")"param=[]

for index in range(1,sheetnrows):

row_values=sheetrow_values(index)

paramappend(row_values)

curexecutemany(sql,param) #插入数据

conncommit()

curclose()

connclose() #释放数据连接

以上就是关于python把爬到的数据放到数据库(python爬虫怎么把爬的数据写进文件里)全部的内容,包括:python把爬到的数据放到数据库(python爬虫怎么把爬的数据写进文件里)、Python上传excel文件到Oracle数据库(csv,xlsx,xls)、python 简单的数据导入数据库程序解析问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10188139.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存