使用正则表达式解析HTML充满陷阱。HTML不是一种常规语言,因此无法使用正则表达式进行100%正确的解析。这只是您将遇到的许多问题之一。最好的方法是使用HTML
/ XML解析器为您完成此 *** 作。
这是我不久前写的博客文章的链接,其中包含有关此问题的更多详细信息。
- http://blogs.msdn.com/b/jaredpar/archive/2008/10/15/regular-expression-limitations.aspx
话虽如此,这是一种应解决此特定问题的解决方案。但这绝不是一个完美的解决方案。
var pattern = @"<(img|a)[^>]*>(?<content>[^<]*)<";var regex = new Regex(pattern);var m = regex.Match(sSummary);if ( m.Success ) { sResult = m.Groups["content"].Value;
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)