c# – 如何在HtmlAgilityPack中逐个元素地获取

c# – 如何在HtmlAgilityPack中逐个元素地获取,第1张

概述您好我制作HttpWebResponse并获取 HtmlPage以及我需要的所有数据,例如带有日期信息的表,我需要将它们保存到数组列表并将其保存到xml文件 html页面示例 <table><tr><td class="padding5 sorting_1"><span class="DateHover">01.03.14</span></td><td class="padding5 s 您好我制作httpWebResponse并获取 HtmlPage以及我需要的所有数据,例如带有日期信息的表,我需要将它们保存到数组列表并将其保存到xml文件

HTML页面示例

<table><tr><td ><span >01.03.14</span></td><td ><span  >10.03.14</span></td></tr></table>

我使用HTMLAgilityPack无效的代码

private static string GetDataByIClass(string HTMLIn,string ClasstoGet)    {        HTMLAgilityPack.HTMLdocument Doctoparse = new HTMLAgilityPack.HTMLdocument();        Doctoparse.LoadHTML(HTMLIn);        HTMLAgilityPack.HTMLNode inputNode = Doctoparse.GetElementbyID(ClasstoGet);//here is the problem i dont have method Doctoparse.GetElementbyClass        if (inputNode != null)        {            if (inputNode.Attributes["value"].Value != null)            {                return inputNode.Attributes["value"].Value;            }        }        return null;    }

母猪我需要读取此数据以获取日期01.03.14和10.02.14,以便能够将其保存到数组列表(然后再保存到xml文件)

播下任何想法我怎么能得到这个日期(01.03.14和10.02.14)?

解决方法 HTML Agility Pack支持XPATH,因此您可以执行以下 *** 作:

foreach (HTMLNode node in doc.documentNode.SelectNodes("//span[@class='" + ClasstoGet + "']")){    string value = node.InnerText;    // etc...}

这意味着:从文档顶部(第一个/)获取具有给定CLASS属性的递归(第二个/)的所有SPAN元素.然后为每个元素获取内部文本.

总结

以上是内存溢出为你收集整理的c# – 如何在HtmlAgilityPack中逐个元素地获取全部内容,希望文章能够帮你解决c# – 如何在HtmlAgilityPack中逐个元素地获取所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1218992.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-05
下一篇 2022-06-05

发表评论

登录后才能评论

评论列表(0条)

保存