概述我很想知道如何擦除html
页面并很好地呈现它 – 删除所有杂乱的内容并将主文本重新格式化为一种非常易读的格式 – 如 http://lab.arc90.com/experiments/readability或Instapaper. 它是一个简单的页面解析和删除不在其中的元素吗? 这是在其他地方讨论的吗? https://github.com/jiminoc/goose/wiki就像你问的那样,源代 我很想知道如何擦除HTML页面并很好地呈现它 – 删除所有杂乱的内容并将主文本重新格式化为一种非常易读的格式 – 如 http://lab.arc90.com/experiments/readability或Instapaper.
它是一个简单的页面解析和删除不在其中的元素吗?
这是在其他地方讨论的吗?
解决方法 https://github.com/jiminoc/goose/wiki就像你问的那样,源代码可以公开获得,还有单元测试 总结
以上是内存溢出为你收集整理的如何实现类似于Arc90的可读性或Instapaper的html页面清理器?全部内容,希望文章能够帮你解决如何实现类似于Arc90的可读性或Instapaper的html页面清理器?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
评论列表(0条)