返回顶部

收藏

python通过正则获取网页上的全部链接

更多
import re, urllib
htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)
linksList = re.findall('<a href=(.*?)>.*?</a>',htmlSource)
for link in linksList:
    print link

标签:python

收藏

0人收藏

支持

0

反对

0

发表评论