如何获取html页面的所有文字

如何获取html页面的所有文字,第1张

用正则表达式的方法

<SCRIPT LANGUAGE="vbScript">

dim str

str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码。"

alert RegExpTest("[\u4e00-\u9fa5]",str)

Function RegExpTest(patrn, strng)

Dim regEx, Match, Matches ' 建立变量。

Set regEx = New RegExp ' 建立正则表达式。

regExPattern = patrn ' 设置模式。

regExIgnoreCase = True ' 设置是否区分大小写。

regExGlobal = True ' 设置全局替换。

Set Matches = regExExecute(strng) ' 执行搜索。

For Each Match in Matches ' 遍历 Matches 集合。

RetStr = RetStr & MatchValue

Next

RegExpTest = RetStr

End Function

</SCRIPT>

两个页面分开的话,获取另外一个页面是比较麻烦的。

可行的办法是将另一个页面放在第一个页面的iframe中,将其display设置为none,然后设置ID,比如:<iframe id="frame" src="xxxhtml" style="display:none">

用js直接获取就行了,var w = documentgetElementById("frame")contentWindow; var elem = wgetElementById("xxx");//这就是另一个页面中的元素

1、浏览器打开网页,右键-》查看源代码

然后Ctrl+S保存下来

2、打开要保存的网页,直接Ctrl+S,选择“仅HTML”

以上两种方法,选择其一即可。

以上就是关于如何获取html页面的所有文字全部的内容,包括:如何获取html页面的所有文字、获取html页面元素、怎样取得网页中的HTML源代码等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9556498.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存