已上传附件,请及时下载,如符合要求请采纳,谢谢!如有问题请追问。提问者下载不扣财富值。如需发送到邮箱请私信给我。我是左拉公主,看清楚我的名字,别采纳错哦!
def getImg(html):reg = r'<url>[^<]*[^u]*[^r]*[^l]*[^>]*</url>'
imgae = re.compile(reg) #comile拼写错了
imglist = re.findall(imgae, str(html))
return imglist #正则也需要修改下,如下:
import re, urllib
def sfinds(start_str, end, html):
start = html.find(start_str)
if start >= 0:
start += len(start_str)
end = html.find(end, start)
if end >= 0:
return html[start:end].strip()
def getHtml(url):
p = urllib.urlopen(url)
html = p.read()
return html
def getImg(html):
reg = r'<img\s*src\s*="?(\S+)"?'
imgae = re.compile(reg)
imglist = re.findall(imgae, str(html))
return imglist
print getImg(getHtml('http://image.baidu.com/'))
如果解决了您的问题请采纳!
如果未解决请继续追问
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)