python 代理ip爬取,ip代理,数据库存储,去重,验证。

python 代理ip爬取,ip代理,数据库存储,去重,验证。,第1张

首先是ip_request.py

这个模块是对ip的一个验证,随机生成header头。

ip_to_mysql.py

本文是对ip进行存储,和提取ip,删除ip的 *** 作。

这个是对日志的一个封装,这样用起来方便些。

总结,目前整体程序可优化的空间很大,这算是1.0版本

看你用到啥程度,要是比较浅显,一般用pyodbc链接ODBC的模式就能访问PI数据库

还有http协议的模式,PI WEB API ,这些python都没问题。

但如果你用的比较深入,PI LIB 用的是C接口,你写一套C++,编译成dll,然后python在调用,这个也没必要。还不如放弃用python。

Python中常用的数据库有很多,需要根据不同的业务和应用场景来选择合适的数据库,才能使程序更高效.

一般常用的主要有 MySQL, Redis, MangoDB 等数据库

学习这些数据库,可以看黑马程序员视频库的学习视频,有代码、有资料,有PPT,不了解还可以问老师!


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6935893.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-30
下一篇 2023-03-30

发表评论

登录后才能评论

评论列表(0条)

保存