返回顶部

收藏

python正则表达式提取网页URL

更多

python正则表达式提取网页URL

import re
import urllib
url="http://www.open-open.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
print i
else:
print 'this is over'

标签:python

收藏

0人收藏

支持

0

反对

0

发表评论