如何在python中使用Selenium和Beautifulsoup解析网站?[关闭]

如何在python中使用Selenium和Beautifulsoup解析网站?[关闭],第1张

如何在python中使用Selenium和Beautifulsoup解析网站?[关闭]

假设您在要解析的页面上,Selenium将源HTML存储在驱动程序

page_source
属性中。这样,你会加载
page_source
BeautifulSoup
如下:

In [8]: from bs4 import BeautifulSoupIn [9]: from selenium import webdriverIn [10]: driver = webdriver.Firefox()In [11]: driver.get('http://news.ycombinator.com')In [12]: html = driver.page_sourceIn [13]: soup = BeautifulSoup(html)In [14]: for tag in soup.find_all('title'):   ....:     print tag.text   ....:        ....:     Hacker News


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5668196.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存