# -*-.Coding: utf-8 -*-# __author__ = 'xiaobai'# Email: [email protected]import timeimport refrom selenium.webdriver import Chrome # 导入浏览器的包from selenium.webdriver.common.keys import Keysn = 1# 创建浏览器web = Chrome()# 打开浏览器,请求到拉钩web.get("https://www.lagou.com")web.find_element_by_xpath('//*[@ID="cBoxClose"]').click()time.sleep(1)# 找到那个文本框,输入python,然后点查询web.find_element_by_xpath('//*[@ID="search_input"]').send_keys('python',Keys.ENTER)alst = web.find_elements_by_class_name("position_link")for a in alst: # 找到H3并点击 a.find_element_by_tag_name("h3").click() web.switch_to.window(web.window_handles[-1]) text= web.find_element_by_xpath('//*[@ID="job_detail"]/dd[2]').text # 拿文本 # 把招聘信息保存到文件中 with open(f'需求_{n}.txt',mode = 'w',enCoding='utf-8') as f: f.write(text) n += 1 # 关闭窗口 web.close() # 调整窗口到最开始的那个页面 web.switch_to.window(web.window_handles[0]) time.sleep(1)总结
以上是内存溢出为你收集整理的python爬虫实例--爬取拉勾网全部内容,希望文章能够帮你解决python爬虫实例--爬取拉勾网所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)