我可以使用Watir在没有监视器的情况下从Linux服务器上的网站抓取数据吗?

我可以使用Watir在没有监视器的情况下从Linux服务器上的网站抓取数据吗?,第1张

我可以使用Watir在没有监视器的情况下从Linux服务器上的网站抓取数据吗?

做这件事有很多种方法

  1. 使用HtmlUnit或Celerity或watir-webdriver(通过远程Selenium2 / WebDriver服务器)。

  2. 使用真实的浏览器+虚拟X服务器(Xvfb)。我建议使用watir-webdriver的Firefox驱动程序和Headless gem,这是从Ruby控制它的简单方法。

这基本上是速度和现实之间的权衡。如果网站有任何复杂的Javascript或无效的HTML,我个人将使用#2,但是两种方法都值得研究。

对于未来,我一直在关注这个项目,这看起来像一个很棒的主意。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5012331.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-14
下一篇 2022-11-14

发表评论

登录后才能评论

评论列表(0条)

保存