我的抓取工具正在缓存网页的HTML并将其写入本地机器上的文件。我想“漂亮打印”HTML,以便在我这样做时看起来很好,格式正确。
解决方法 通过“漂亮的打印”HTML页面,我认为你的意思是想要用适当的缩进格式重新格式化HTML结构。诺基里不支持pretty_print方法用于“pp”库,输出仅用于调试。有几个项目能够很好地理解HTML,以便能够重新格式化,而不会破坏实际上重要的空白(着名的是HTML Tidy),但是通过谷歌搜索,我发现这篇文章是“Pretty printing XHTML with Nokogiri and XSLT”。
归结为:
xsl = Nokogiri::XSLT(file.open("pretty_print.xsl"))HTML = Nokogiri(file.open("source.HTML"))puts xsl.apply_to(HTML).to_s
它需要您,当然,将链接的xsl文件下载到您的文件系统。我在我的机器上很快尝试了,它的作用就像一个魅力。
总结以上是内存溢出为你收集整理的如何用Nokogiri漂亮打印HTML?全部内容,希望文章能够帮你解决如何用Nokogiri漂亮打印HTML?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)