怎么去除字符串中的html标签

怎么去除字符串中的html标签,第1张

去除字符串中的html标签: 1 public static string Html2Text(string htmlStr)

3 {

5     if (String.IsNullOrEmpty(htmlStr))

7     {

9         return ""

10 

11     }

12 

13     string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>" //定义style的正则表达式 

14 

15     string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>" //定义script的正则表达式   

16 

17     string regEx_html = "<[^>]+>" //定义HTML标签的正则表达式   

18 

19     htmlStr = Regex.Replace(htmlStr, regEx_style, "")//删除css

20 

21 htmlStr = Regex.Replace(htmlStr, regEx_script, "")//删除js

22 

23     htmlStr = Regex.Replace(htmlStr, regEx_html, "")//删除html标记

24 

25     htmlStr = Regex.Replace(htmlStr, "\\s*|\t|\r|\n", "")//去除tab、空格、空行

26 

27     htmlStr = htmlStr.Replace(" ", "")

28 

29     htmlStr = htmlStr.Replace(""", "")//去除异常的引号" " "

30 

31     htmlStr = htmlStr.Replace(""", "")

32 

33     return htmlStr.Trim()

34 

35 }

这函数挺有用的,这是总结后的知识点,希望能帮到你!

strip_tags

(PHP 4, PHP 5, PHP 7, PHP 8)

strip_tags — 从字符串中去除 HTML 和 PHP 标记

说明

strip_tags ( string $str , string $allowable_tags = ? ) : string

该函数尝试返回给定的字符串 str 去除空字符、HTML 和 PHP 标记后的结果。它使用与函数 fgetss() 一样的机制去除标记。

参数

str

输入字符串。

allowable_tags

使用可选的第二个参数指定不被去除的字符列表。

注意:

HTML 注释和 PHP 标签也会被去除。这里是硬编码处理的,所以无法通过 allowable_tags 参数进行改变。

注意:

In PHP 5.3.4 and later, self-closing XHTML tags are ignored and only non-self-closing tags should be used in allowable_tags. For example, to allow both

and , you should use:')

?>

返回值

返回处理后的字符串。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7294483.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存