Python机械化,跟随URL链接,nr参数是什么?

Python机械化,跟随URL链接,nr参数是什么?,第1张

Python机械化,跟随URL链接,nr参数是什么?

br.follow_link
接受一个
link
对象或关键字arg(例如
nr=0
)。

br.links()
列出所有链接。

br.links(url_regex='...')
列出其URL与正则表达式匹配的所有链接。

br.links(text_regex='...')
列出其链接文本与正则表达式匹配的所有链接。

br.follow_link(nr=num)
跟随
num
页面上的th链接,从0开始计数。它返回一个响应对象(与br.open(…)返回的对象相同)

br.find_link(url='...')
返回其
link
对象
url
完全等于给定url的对象。

br.find_link
br.links
br.follow_link
br.click_link
都接受相同的关键字。运行
help(br.find_link)
以查看有关这些关键字的文档。

编辑: 如果您有一个希望遵循的目标URL,则可以执行以下 *** 作:

import mechanizebr = mechanize.Browser()response=br.open("http://www.example.com/")target_url='http://www.rfc-editor.org/rfc/rfc2606.txt'for link in br.links():    print(link)    # link(base_url='http://www.example.com/', url='http://www.rfc-editor.org/rfc/rfc2606.txt', text='RFC 2606', tag='a', attrs=[('href', 'http://www.rfc-editor.org/rfc/rfc2606.txt')])    print(link.url)    # http://www.rfc-editor.org/rfc/rfc2606.txt    if link.url == target_url:        print('match found')        # match found         breakbr.follow_link(link)   # link still holds the last value it had in the loopprint(br.geturl())# http://www.rfc-editor.org/rfc/rfc2606.txt


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5674334.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存