用正则表达式的方法
<SCRIPT LANGUAGE="vbScript">
dim str
str="怎样从一个Html页面中提取所有汉字呢?不能有其它Html代码。"
alert RegExpTest("[\u4e00-\u9fa5]",str)
Function RegExpTest(patrn, strng)
Dim regEx, Match, Matches ' 建立变量。
Set regEx = New RegExp ' 建立正则表达式。
regExPattern = patrn ' 设置模式。
regExIgnoreCase = True ' 设置是否区分大小写。
regExGlobal = True ' 设置全局替换。
Set Matches = regExExecute(strng) ' 执行搜索。
For Each Match in Matches ' 遍历 Matches 集合。
RetStr = RetStr & MatchValue
Next
RegExpTest = RetStr
End Function
</SCRIPT>
两个页面分开的话,获取另外一个页面是比较麻烦的。
可行的办法是将另一个页面放在第一个页面的iframe中,将其display设置为none,然后设置ID,比如:<iframe id="frame" src="xxxhtml" style="display:none">
用js直接获取就行了,var w = documentgetElementById("frame")contentWindow; var elem = wgetElementById("xxx");//这就是另一个页面中的元素
1、浏览器打开网页,右键-》查看源代码
然后Ctrl+S保存下来
2、打开要保存的网页,直接Ctrl+S,选择“仅HTML”
以上两种方法,选择其一即可。
以上就是关于如何获取html页面的所有文字全部的内容,包括:如何获取html页面的所有文字、获取html页面元素、怎样取得网页中的HTML源代码等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)