如果相对div中间的内容处理的更佳完备,我建议用jquery来处理,简单举个例子:$("div")text(); 获取中间的文本,不包括html标签;$("div")html(); 获取中间的所有内容,$("div:first")html(); 获取第一个DIV中间的所有内容等等,是不是觉得比单纯的javascript脚本更完善呢?
<div[^>]+>\s(:<[^>]+>\s)+(\w+)
这是第一个字符(对应(\w+)
第一、二个字符:
<div[^>]>\s(:<[^>]+>\s)+(\w+)\s(:<[^>]+>\s)+(\w+)
依次类推。
较麻烦,可以用
循环替换方法,将div标签中的 所有 <> 内容替换为空,剩余的字符就有所有的字符串。
<div[^>]+>(<[^>]+>)
将捕获替换为空,需要多次查找替换,直到查找不到为止。
<html>
<head>
<title>获取显示 <DIV> contenteditable="true" 时 输入的内容</title>
</head>
<body>
<div id="kk" style="width:400px;height:300px;border:1px solid #999999;" contenteditable="true">
</div>
<input type="button" value="code" onclick="alert(documentgetElementById('kk')innerHTML)" />
</body>
</html>
1、编写爬虫思路:
确定下载目标,找到网页,找到网页中需要的内容。对数据进行处理。保存数据。
2、知识点说明:
1)确定网络中需要的信息,打开网页后使用F12打开开发者模式。
在Network中可以看到很多信息,我们在页面上看到的文字信息都保存在一个html文件中。点击文件后可以看到response,文字信息都包含在response中。
对于需要输入的信息,可以使用ctrl+f,进行搜索。查看信息前后包含哪些特定字段。
对于超链接的提取,可以使用最左边的箭头点击超链接,这时Elements会打开有该条超链接的信息,从中判断需要提取的信息。从下载小说来看,在目录页提取出小说的链接和章节名。
2)注意编码格式
输入字符集一定要设置成utf-8。页面大多为GBK字符集。不设置会乱码。
jQuery 获取 div 之间的内容,有两种方法,$(selector)text()、$(selector)html() 。
html:
<div>
<p>test</p>
</div>
$("div")text() 得到的是 test,是 div 的纯文本,会自动忽略 html 标签 。
$("div")html() 得到的是 <p>test</p>,是 div 的所有内容,包括 html 标签,它有个好处是可以将 得到的标签与文字 直接再利用,比如添加到页面其他地方之类的 *** 作 。
以上就是关于怎么获取div标签之间的内容全部的内容,包括:怎么获取div标签之间的内容、正则表达式获取div标签里面的内容、在web开发里 js如何获取获取div 的contentEditable内容 用于再提交等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)