BeautifulSoup

BeautifulSoup,第1张

概述安装BeautifulSoup 1.Linux 系统上的安装:   sudo apt-get install python-bs4 2.Mac系统   pip install beatifulsoup4 3.Windows系统   pip install beatifulsoup4   html = urlopen("http://www.baidu.com") 这行代码可能出现两种异常 1.网页

安装BeautifulSoup

1.linux 系统上的安装:

  sudo apt-get install python-bs4

2.Mac系统

  pip install beatifulsoup4

3.windows系统

  pip install beatifulsoup4

 

HTML = urlopen("http://www.baIDu.com")

这行代码可能出现两种异常

1.网页在服务器上不存在

2.服务器不存在

第一种会抛出httpError异常

第二种会抛出HTMLError异常

如果调用的标签不存在,就会返回AttributeError

 

返回网页标题的封装函数

from urllib.request import urlopenfrom urllib.error import httpError,URLErrorfrom bs4 import BeautifulSoupdef getTitle(url):    try:        HTML = urlopen(url)    except (httpError,URLError) as e:        return None    try:        bs0bj = BeautifulSoup(HTML.read())        Title = bs0bj.body.h1    except AttributeError as e:        return None    return TitleTitle = getTitle("https://www.douban.com")if Title == None:    print("Title Could not be found")else:    print(Title)
总结

以上是内存溢出为你收集整理的BeautifulSoup全部内容,希望文章能够帮你解决BeautifulSoup所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/1024671.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-23
下一篇 2022-05-23

发表评论

登录后才能评论

评论列表(0条)

保存