c# – 在文档中查找HTML字符串

c# – 在文档中查找HTML字符串,第1张

概述我想获取所有 HTML< p> …< / p>在一份文件中. 使用 Regex查找所有此类字符串: Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase); 但我无法得到任何结果.我的正则表达式有什么问题吗? 现在,我只想获得介于< p> …< / p>之间的所有内容.标签,并希望使用正则表达式,因为源不是H 我想获取所有 HTML< p> …< / p>在一份文件中.
使用 Regex查找所有此类字符串:

Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>",RegexOptions.IgnoreCase);

但我无法得到任何结果.我的正则表达式有什么问题吗?

现在,我只想获得介于< p> …< / p>之间的所有内容.标签,并希望使用正则表达式,因为源不是HTML文档.

解决方法 DO NOT PARSE HTML USING Regular Expressions!

相反,使用HTML Agility Pack.

例如:

var doc = new HTML@R_419_4617@();doc.Load(...);var pTags = doc.@R_419_4617@Node.Descendants("p");

编辑:即使文档实际上不是HTML,您也可以这样做.

总结

以上是内存溢出为你收集整理的c# – 在文档中查找HTML字符串全部内容,希望文章能够帮你解决c# – 在文档中查找HTML字符串所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1225725.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-05
下一篇 2022-06-05

发表评论

登录后才能评论

评论列表(0条)

保存