1.需要安装那些库
1.1Python
1.2请求库的安装
请求库模拟浏览器向服务器发出请求,需要一些Python库来实现HTTP请求 *** 作。
1.2.1requests
1.2.2Selenium
1.2.3chromedriver
1.2.4aiohttp
1.3解析库的安装
抓取网页代码后,就要进一步从网页中提取信息。
1.3.1lxml
1.3.2BeautifulSoup
1.3.3pyquery
1.3.4tesserocr
1.4数据库的安装
存储爬取解析得到的数据。
1.4.1MySQL
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)