安装BeautifulSoup
1.linux 系统上的安装:
sudo apt-get install python-bs4
2.Mac系统
pip install beatifulsoup4
3.windows系统
pip install beatifulsoup4
HTML = urlopen("http://www.baIDu.com")
这行代码可能出现两种异常
1.网页在服务器上不存在
2.服务器不存在
第一种会抛出httpError异常
第二种会抛出HTMLError异常
如果调用的标签不存在,就会返回AttributeError
返回网页标题的封装函数
from urllib.request import urlopenfrom urllib.error import httpError,URLErrorfrom bs4 import BeautifulSoupdef getTitle(url): try: HTML = urlopen(url) except (httpError,URLError) as e: return None try: bs0bj = BeautifulSoup(HTML.read()) Title = bs0bj.body.h1 except AttributeError as e: return None return TitleTitle = getTitle("https://www.douban.com")if Title == None: print("Title Could not be found")else: print(Title)总结
以上是内存溢出为你收集整理的BeautifulSoup全部内容,希望文章能够帮你解决BeautifulSoup所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)