python爬虫实例--爬取拉勾网

python爬虫实例--爬取拉勾网,第1张

概述代码实例 # -*-.coding: utf-8 -*-# __author__ = 'xiaobai'# Email: [email protected]import timeimport refrom selenium.webdriver import Chrome # 导入浏览器的包from selenium.webdriver.common.keys import Keysn 代码实例
# -*-.Coding: utf-8 -*-# __author__ = 'xiaobai'# Email: [email protected]import timeimport refrom selenium.webdriver import Chrome # 导入浏览器的包from selenium.webdriver.common.keys import Keysn = 1# 创建浏览器web = Chrome()# 打开浏览器,请求到拉钩web.get("https://www.lagou.com")web.find_element_by_xpath('//*[@ID="cBoxClose"]').click()time.sleep(1)# 找到那个文本框,输入python,然后点查询web.find_element_by_xpath('//*[@ID="search_input"]').send_keys('python',Keys.ENTER)alst = web.find_elements_by_class_name("position_link")for a in alst:    # 找到H3并点击    a.find_element_by_tag_name("h3").click()    web.switch_to.window(web.window_handles[-1])    text= web.find_element_by_xpath('//*[@ID="job_detail"]/dd[2]').text # 拿文本    # 把招聘信息保存到文件中    with open(f'需求_{n}.txt',mode = 'w',enCoding='utf-8') as f:        f.write(text)        n += 1    # 关闭窗口    web.close()    # 调整窗口到最开始的那个页面    web.switch_to.window(web.window_handles[0])    time.sleep(1)
总结

以上是内存溢出为你收集整理的python爬虫实例--爬取拉勾网全部内容,希望文章能够帮你解决python爬虫实例--爬取拉勾网所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1191774.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存