https://bitbucket.org/rflechner/scrapysharp/wiki/Home
无论我尝试什么,我都找不到库应该添加的CSSSelect()方法,以使查询更容易.这是我尝试过的:
using ScrapySharp.Core;using ScrapySharp.HTML.Parsing;using HTMLAgilityPack;HTMLWeb web = new HTMLWeb();HTMLdocument doc = web.Load("http://www.stackoverflow.com");var page = doc.documentNode.SelectSingleNode("//body");page.CSSSel???
具体如何使用此库?在文档中,不清楚HTML是什么类型.
解决方法 加using ScrapySharp.Extensions;
看起来你错过了.这应该使CSSSelect可用.
为了防止示例有用,这里也是我在项目中使用的方法:
private string GetpdfUrl(HTMLdocument document,string baseUrl){ return new Uri(new Uri(baseUrl),document.documentNode.CSSSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString();}总结
以上是内存溢出为你收集整理的c# – 如何使用ScrapySharp解析html文档中的元素?全部内容,希望文章能够帮你解决c# – 如何使用ScrapySharp解析html文档中的元素?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)