linux– 获取浏览器呈现的html javascript

linux– 获取浏览器呈现的html javascript,第1张

概述我需要一个comandline工具(或Javascript / PHP,但我认为命令行是一种方式)用于渲染并获取URL的渲染内容,但重要的是我需要渲染Javascript而不仅仅是CSS / Html /图像.例如,命令如:“renderengine http://www.google.es outputfile.html”和web的内容(解析的html和j

我需要一个comandline工具(或Javascript / PHP,但我认为命令行是一种方式)用于渲染并获取URL的渲染内容,但重要的是我需要渲染JavaScript而不仅仅是CSS / HTML /图像.

例如,命令如:“renderengine http://www.google.es outputfile.HTML”和web的内容(解析的HTML和JavaScript执行)保存在outputfile.HTML中.

我需要这个,因为我需要像一个完整的JavaScript网站的结果,如groovehark,网站加载所有使用JavaScript / AJAX和爬虫没有找到任何东西,只有基本的HTML空模板(因为使用AJAX / javscript后加载)

存在任何linux浏览器引擎,支持JavaScript(例如V8),输出结果以保存在文件中?

最佳答案尝试www.phantomjs.org中的phantomJs,您可以轻松修改包含的rasterize.Js以导出呈现的HTML.它基于webkit并对您的目标网站的JavaScript进行全面评估,允许您根据需要调整超时或首先执行您自己的代码.我个人用它来保存完全渲染的knockout.Js模板的硬拷贝HTML文件版本.

它执行JavaScript所以我只是做了这样的事情并将控制台输出保存到文件中:

var markup = page.evaluate(function(){return document.documentElement.INNERHTML;});console.log(markup);phantom.exit();
总结

以上是内存溢出为你收集整理的linux – 获取浏览器呈现的html javascript全部内容,希望文章能够帮你解决linux – 获取浏览器呈现的html javascript所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/1046969.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-24
下一篇 2022-05-24

发表评论

登录后才能评论

评论列表(0条)

保存