基本上相当于Jsoup / Beautiful Soup.
主要要求是能够使用css选择器查询DOM.
形式的东西
page.fetch("http://www.url.com")page.find("#tag")解决方法 我最近需要这样的东西,所以在看到这个问题并阅读评论中的建议后,我在周末写了一个图书馆“ Lambda Soup”以获得乐趣.
您将需要使用像ocurl或Cohttp这样的库来检索实际的HTML.拥有它之后,你就可以做到
HTML |> parse $"#tag"
做问题中提出的问题.有关其他可能性和完整签名,请参阅documentation.您可能需要查看文档postprocessor或tests,以获得相当全面的使用和功能演示,包括CSS支持和扩展.
根据评论,Lambda Soup使用Ocamlnet的HTML解析器. Lambda Soup使用Markup.ml.否则,除了OUnit之外,它没有依赖关系,如果你想运行测试.我很高兴有任何反馈,包括修改界面(它处于早期阶段)或讨论向库中添加http下载程序(这似乎是因为它极大地改变了现在的库的范围,但是我很高兴听到争论).
许可证是BSD.
总结以上是内存溢出为你收集整理的使用OCaml解析HTML全部内容,希望文章能够帮你解决使用OCaml解析HTML所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)