br.follow_link接受一个
link对象或关键字arg(例如
nr=0)。
br.links()列出所有链接。
br.links(url_regex='...')列出其URL与正则表达式匹配的所有链接。
br.links(text_regex='...')列出其链接文本与正则表达式匹配的所有链接。
br.follow_link(nr=num)跟随
num页面上的th链接,从0开始计数。它返回一个响应对象(与br.open(…)返回的对象相同)
br.find_link(url='...')返回其
link对象
url完全等于给定url的对象。
br.find_link,
br.links,
br.follow_link,
br.click_link都接受相同的关键字。运行
help(br.find_link)以查看有关这些关键字的文档。
编辑: 如果您有一个希望遵循的目标URL,则可以执行以下 *** 作:
import mechanizebr = mechanize.Browser()response=br.open("http://www.example.com/")target_url='http://www.rfc-editor.org/rfc/rfc2606.txt'for link in br.links(): print(link) # link(base_url='http://www.example.com/', url='http://www.rfc-editor.org/rfc/rfc2606.txt', text='RFC 2606', tag='a', attrs=[('href', 'http://www.rfc-editor.org/rfc/rfc2606.txt')]) print(link.url) # http://www.rfc-editor.org/rfc/rfc2606.txt if link.url == target_url: print('match found') # match found breakbr.follow_link(link) # link still holds the last value it had in the loopprint(br.geturl())# http://www.rfc-editor.org/rfc/rfc2606.txt
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)