中国新闻网中有一个即时新闻精选频道,我们想随时看到只需要写一个爬取程序,然后通过此程序就可以完成爬取,不必再打开网站。
import requests
from bs4 import BeautifulSoup as bs
url = 'https://www.chinanews.com.cn/'
# 网址
# header加不加都可以
header = {}
# 获取网页
resp = requests.get(url)
resp.encoding = 'utf-8'
#print(resp.text)
html = bs(resp.text, "html.parser")
# print(html.text)
# print(html)
# 找到想要爬取的内容对应的标签
ul_bs = html.find('div', class_="new_right_content").find_all("ul")
#print(ul_bs)
for a in ul_bs:
print(a.text)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)