Scrapy Shell和Scrapy Splash

Scrapy Shell和Scrapy Splash,第1张

Scrapy Shell和Scrapy Splash

只需将要封装的URL包装在启动http api中。

因此,需要以下内容:

scrapy shell 'http://localhost:8050/render.html?url=http://domain.com/page-with-javascript.html&timeout=10&wait=0.5'

这里

localhost:port
是你的飞溅服务运行的位置
url
是URL要抓取和不要忘记urlquote吧!
render.html
是可能的http api端点之一,在这种情况下,
timeout
以秒为单位返回经过重编的html页面,以秒为单位的超时
wait
时间返回以等待javascript执行,然后再读取/保存html。




欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4900620.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-12
下一篇 2022-11-12

发表评论

登录后才能评论

评论列表(0条)

保存