c# – 如何使用ScrapySharp解析html文档中的元素?

c# – 如何使用ScrapySharp解析html文档中的元素?,第1张

概述这是项目官方“文档”: https://bitbucket.org/rflechner/scrapysharp/wiki/Home 无论我尝试什么,我都找不到库应该添加的CssSelect()方法,以使查询更容易.这是我尝试过的: using ScrapySharp.Core;using ScrapySharp.Html.Parsing;using HtmlAgilityPack;Html 这是项目官方“文档”:

https://bitbucket.org/rflechner/scrapysharp/wiki/Home

无论我尝试什么,我都找不到库应该添加的CSSSelect()方法,以使查询更容易.这是我尝试过的:

using ScrapySharp.Core;using ScrapySharp.HTML.Parsing;using HTMLAgilityPack;HTMLWeb web = new HTMLWeb();HTMLdocument doc = web.Load("http://www.stackoverflow.com");var page = doc.documentNode.SelectSingleNode("//body");page.CSSSel???

具体如何使用此库?在文档中,不清楚HTML是什么类型.

解决方法 加
using ScrapySharp.Extensions;

看起来你错过了.这应该使CSSSelect可用.

为了防止示例有用,这里也是我在项目中使用的方法:

private string GetpdfUrl(HTMLdocument document,string baseUrl){    return new Uri(new Uri(baseUrl),document.documentNode.CSSSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString();}
总结

以上是内存溢出为你收集整理的c# – 如何使用ScrapySharp解析html文档中的元素?全部内容,希望文章能够帮你解决c# – 如何使用ScrapySharp解析html文档中的元素?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1263537.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-08
下一篇 2022-06-08

发表评论

登录后才能评论

评论列表(0条)

保存