// 创建一个html对象,这个抓的是谷歌的首页
$html = file_get_html('http://www.google.com/')
//找到对象中所有的img的src
foreach($html->find('img') as $element)
echo $element->src . '<br>'
//找到对象中所有的a的href
foreach($html->find('a') as $element)
echo $element->href . '<br>'
就是以前你采集的时候,先file_get_contents把目标url的页面源码抓过来,假如要页面里的a标签的href,你要用正则分析。现在有了这个simple_html_dom。直接可以帮你分析出你需要的a标签里的href。
请采纳答案,支持我一下。
这是一个 PHP5 的 HTML 文档解析器,示例代码:// 创建一个html对象,这个抓的是谷歌的首页
$html = file_get_html('http://www.google.com/')
//找到对象中所有的img的src
foreach($html->find('img') as $element)
echo $element->src . '<br>'
//找到对象中所有的a的href
foreach($html->find('a') as $element)
echo $element->href . '<br>'
就是以前你采集的时候,先file_get_contents把目标url的页面源码抓过来,假如要页面里的a标签的href,你要用正则分析。现在有了这个simple_html_dom。直接可以帮你分析出你需要的a标签里的href。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)