小编介绍过Python中urllib.parse模块的的urlparse可以将 URL 解析成 ParseResult 对象,实现url的识别和分段。作为urllib.parse模块的urljoin()方法也应用于url,作用与urlparse相反,是用于拼接url。除了可以组接url,还可以对网址进行拼接,本文介绍它的使用方法。
1、urllib.parse模块的urljoin()方法
urljoin()方法将两个链接参数拼接为完整URL,用于拼接url。
2、使用格式
urljoin(base, url, allow_fragments=True)
连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主。
3、urljoin()组接url使用实例
# 连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主 from urllib.parse import urljoin print(urljoin('www.baidu.com', '?category=2#comment')) print(urljoin('www.baidu.com', 'https://blog.csdn.net/nav/python')) 输出 www.baidu.com?category=2#comment https://blog.csdn.net/nav/python
4、urljoin()对网址进行拼接使用实例
from urllib.parse import urljoin print(urljoin('http://www.baidu.com','FAQ.html')) #http://www.baidu.com/FAQ.html print(urljoin('www.baidu.com','?category=2#comment')) #www.baidu.com?category=2#comment print(urljoin('www.baidu.com','http://qq.com')) #http://qq.com
以上就是Python中urllib.parse模块的urljoin()使用方法,希望能对你有所帮助哟~更多python爬虫推荐:python爬虫教程。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)