在Python中转义HTML的最简单方法是什么?

在Python中转义HTML的最简单方法是什么?,第1张

在Python中转义HTML的最简单方法是什么?

cgi.escape
很好 它逃脱了:

  • <
    &lt;
  • >
    &gt;
  • &
    &amp;

对于所有HTML而言,这就足够了。

编辑:如果您有非ASCII字符,您还想转义,以便包含在使用不同编码的另一个编码文档中,如 Craig 所说,只需使用:

data.enpre('ascii', 'xmlcharrefreplace')

不要忘了解码

data
unipre
第一,使用任何编码它编码的。

但是根据我的经验,如果您

unipre
从头开始一直都在工作,那么这种编码是没有用的。只需在文档头中指定的编码末尾进行编码(
utf-8
以实现最大兼容性)。

例:

>>> cgi.escape(u'<a>bá</a>').enpre('ascii', 'xmlcharrefreplace')'&lt;a&gt;b&#225;&lt;/a&gt;

另外值得一提的(感谢Greg)是额外的

quote

参数
cgi.escape
。将其设置为
True
cgi.escape
还转义了双引号字符(
"
),因此您可以在XML /
HTML属性中使用结果值。

编辑:请注意,cgi.escape已在Python3.2中弃用,转而使用

html.escape
,它的功能相同,但_
quote
_ 默认情况下为True。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5566646.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存