python爬虫入门

python爬虫入门,第1张

概述1.从guthub项目地址下载项目源码,请支持作者本人。2.安装提到的各种库。Python爬虫入门八之BeautifulSoup的用法

1. 从下载项目源码,请支持作者本人。

2. 安装提到的各种库。

顺便学习一下beautiful soup的用途:

3.  

安装MysqL,net start MysqL   启动报错:

修改注册表有三种方式:。我选择用windows的注册表修改器--regedit.exe:

显示:MySQL 服务正在启动 ..MySQL 服务已经启动成功。成功解决。

配置环境变量:将c:\mysql\bin 路径加入path,可以直接启动mysql。

启动: net start MysqL

停止: net stop MysqL

设置密码:MysqL> set password='XXX'; 

问题原因:你输入的密码是明文。不允许这么输入。

解决办法:用select password('你想输入的密码');查询出你的密码对应的字符串,

--本地连接  :MysqL –uroot -p  

--远程连接  :MysqL –uwgb –hXXX.XXX.XXX.XXX –p 

安装python-MysqL:

4. 获取cookie

5. 修改config.ini文件,运行init.sql文件:MysqL>source d:\test\ss.sql 或者 MysqL>\. d:\test\ss.sql

6.


在window下面用记事本编辑文件的时候,如果保存为UNICODE或UTF-8,分别会在文件的开头加上两个字节“\xFF\xFE”和三个字节“\xEF\xBB\xBF”。 

7.

解决方案:

import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )

总结

以上是内存溢出为你收集整理的python爬虫入门全部内容,希望文章能够帮你解决python爬虫入门所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1209150.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)