// 创建一个html对象,这个抓的是谷歌的首页
$html = file_get_html('http://www.google.com/')
//找到对象中所有的img的src
foreach($html->find('img') as $element)
echo $element->src . '<br>'
//找到对象中所有的a的href
foreach($html->find('a') as $element)
echo $element->href . '<br>'
就是以前你采集的时候,先file_get_contents把目标url的页面源码抓过来,假如要页面里的a标签的href,你要用正则分析。现在有了这个simple_html_dom。直接可以帮你分析出你需要的a标签里的href。
<!DOCTYPE html><html>
<head lang="en">
<meta charset="UTF-8">
<title></title>
<script type="text/javascript">
window.onload = function(){
var $ = function(args){
return document.getElementById(args)
}
var add = $("add")
var rep = $("replace")
var rem = $("remove")
var dom, h
add.onclick = function(){
//新增
dom = document.createElement("p")
dom.innerHTML="<span style='color:red'> 这是一个被p标记包含的 span 标签</span>"
document.body.appendChild(dom)
}
rep.onclick = function(){
//替换
h = document.createElement("h1")
h.innerHTML="<span style='color:green'> 这是一个被h1标记包含的 span 标签</span>"
document.body.replaceChild(h,dom)
dom = null
}
rem.onclick = function(){
//删除
if(dom){
document.body.removeChild(dom)
}else if(h){
document.body.removeChild(h)
}
}
}
</script>
</head>
<body>
<input type="button" value="新增" id="add"/>
<input type="button" value="替换" id="replace"/>
<input type="button" value="删除" id="remove"/>
</body>
</html>
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)