Python确实具有内置函数来正确对待它,例如
p = urlparse.urlparse(my_url, 'http')netloc = p.netloc or p.pathpath = p.path if p.netloc else ''if not netloc.startswith('www.'): netloc = 'www.' + netlocp = urlparse.ParseResult('http', netloc, path, *p[3:])print(p.geturl())
如果要删除(或添加)
www零件,则必须
.netloc在调用之前编辑结果对象的字段
.geturl()。
因为
ParseResult是一个namedtuple,所以您不能就地编辑它,而必须创建一个新对象。
PS:
对于Python3,应该是
urllib.parse.urlparse
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)