使用OCaml解析HTML

使用OCaml解析HTML,第1张

概述我正在寻找一个库来解析OCaml中的 HTML文件. 基本上相当于Jsoup / Beautiful Soup. 主要要求是能够使用CSS选择器查询DOM. 形式的东西 page.fetch("http://www.url.com")page.find("#tag") 我最近需要这样的东西,所以在看到这个问题并阅读评论中的建议后,我在周末写了一个图书馆“ Lambda Soup”以获得乐趣. 您 我正在寻找一个库来解析OCaml中的 HTML文件.
基本上相当于Jsoup / Beautiful Soup.
主要要求是能够使用css选择器查询DOM.
形式的东西

page.fetch("http://www.url.com")page.find("#tag")
解决方法 我最近需要这样的东西,所以在看到这个问题并阅读评论中的建议后,我在周末写了一个图书馆“ Lambda Soup”以获得乐趣.

您将需要使用像ocurl或Cohttp这样的库来检索实际的HTML.拥有它之后,你就可以做到

HTML |> parse $"#tag"

做问题中提出的问题.有关其他可能性和完整签名,请参阅documentation.您可能需要查看文档postprocessor或tests,以获得相当全面的使用和功能演示,包括CSS支持和扩展.

根据评论,Lambda Soup使用Ocamlnet的HTML解析器. Lambda Soup使用Markup.ml.否则,除了OUnit之外,它没有依赖关系,如果你想运行测试.我很高兴有任何反馈,包括修改界面(它处于早期阶段)或讨论向库中添加http下载程序(这似乎是因为它极大地改变了现在的库的范围,但是我很高兴听到争论).

许可证是BSD.

总结

以上是内存溢出为你收集整理的使用OCaml解析HTML全部内容,希望文章能够帮你解决使用OCaml解析HTML所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1078160.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-27
下一篇 2022-05-27

发表评论

登录后才能评论

评论列表(0条)

保存