在R中转换HTML字符实体编码

在R中转换HTML字符实体编码,第1张

概述有没有办法在R转换HTML字符实体编码? 我想转换HTML字符实体 &放大器;放大器;到&要么 &安培; GT;到> 对于Perl,存在可以做到这一点的HTML :: Entities包,但是在R中我找不到类似的东西. 我也试过iconv(),但不能得到令人满意的结果.也许还有一种方法使用XML包,但我还没有想到它. 尝试一下: # load XML packagelibrary(XML)# 有没有办法在R转换HTML字符实体编码

我想转换HTML字符实体
&放大器;放大器;到&要么
&安培; GT;到>

对于Perl,存在可以做到这一点的HTML :: EntitIEs包,但是在R中我找不到类似的东西.

我也试过iconv(),但不能得到令人满意的结果.也许还有一种方法使用XML包,但我还没有想到它.

解决方法 尝试一下:
# load XML packagelibrary(XML)# ConvenIEnce function to convert HTML codesHTML2txt <- function(str) {      xpathApply(HTMLParse(str,asText=TRUE),"//body//text()",xmlValue)[[1]] }# HTML encoded string( x <- paste("i","s","n","&","a","p","o",";","t",sep = "") )[1] "isn&apos;t"# converted stringHTML2txt(x)[1] "isn't"

更新:编辑HTML2txt()函数,因此它适用于更多的情况

总结

以上是内存溢出为你收集整理的在R中转换HTML字符实体编码全部内容,希望文章能够帮你解决在R中转换HTML字符实体编码所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1100633.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-28
下一篇 2022-05-28

发表评论

登录后才能评论

评论列表(0条)

保存