正则表达式删除HTML标签

正则表达式删除HTML标签,第1张

正则表达式删除HTML标签

使用正则表达式解析HTML充满陷阱。HTML不是一种常规语言,因此无法使用正则表达式进行100%正确的解析。这只是您将遇到的许多问题之一。最好的方法是使用HTML
/ XML解析器为您完成此 *** 作。

这是我不久前写的博客文章的链接,其中包含有关此问题的更多详细信息。

  • http://blogs.msdn.com/b/jaredpar/archive/2008/10/15/regular-expression-limitations.aspx

话虽如此,这是一种应解决此特定问题的解决方案。但这绝不是一个完美的解决方案。

var pattern = @"<(img|a)[^>]*>(?<content>[^<]*)<";var regex = new Regex(pattern);var m = regex.Match(sSummary);if ( m.Success ) {   sResult = m.Groups["content"].Value;


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5505804.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-13
下一篇 2022-12-13

发表评论

登录后才能评论

评论列表(0条)

保存