如何实现类似于Arc90的可读性或Instapaper的html页面清理器?

如何实现类似于Arc90的可读性或Instapaper的html页面清理器?,第1张

概述我很想知道如何擦除html页面并很好地呈现它 – 删除所有杂乱的内容并将主文本重新格式化为一种非常易读的格式 – 如 http://lab.arc90.com/experiments/readability或Instapaper. 它是一个简单的页面解析和删除不在其中的元素吗? 这是在其他地方讨论的吗? https://github.com/jiminoc/goose/wiki就像你问的那样,源代 我很想知道如何擦除HTML页面并很好地呈现它 – 删除所有杂乱的内容并将主文本重新格式化为一种非常易读的格式 – 如 http://lab.arc90.com/experiments/readability或Instapaper.

它是一个简单的页面解析和删除不在其中的元素吗?

这是在其他地方讨论的吗?

解决方法 https://github.com/jiminoc/goose/wiki就像你问的那样,源代码可以公开获得,还有单元测试 总结

以上是内存溢出为你收集整理的如何实现类似于Arc90的可读性或Instapaper的html页面清理器?全部内容,希望文章能够帮你解决如何实现类似于Arc90的可读性或Instapaper的html页面清理器?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1047763.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-25
下一篇 2022-05-25

发表评论

登录后才能评论

评论列表(0条)

保存