如何用python抓取网页数据库

如何用python抓取网页数据库,第1张

最简单可以用urllib,python2.x和python3.x的用法不同,以python2.x为例:

import urllib

html = urllib.open(url)

text = html.read()

复杂些可以用requests库,支持各种请求类型,支持cookies,header等

再复杂些的可以用selenium,支持抓取javascript产生的文本

python爬取数据后储存数据到mysql数据库后添加新数据覆盖旧。

1、先根据PRIMARY_KEY或UNIQUE字段查询库里是否存在数据(select)。

2、如果存在数据,则更改许要更改的字段(update)。

3、如果不粗在数据,则进行添加新数据(insert)。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10063796.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存