php 读取(解析)html文档,并将读取到的文档转为数组(数组保留html嵌套格式)

php 读取(解析)html文档,并将读取到的文档转为数组(数组保留html嵌套格式),第1张

可以使用正则表达式来解决这个问题

具体的代码很多不详细写了,举个例子给题主吧

<?php

 

$htmlStr = '<li>首页</li>'

preg_match_all('/<li>.*?<\/li>/', $htmlStr , $res)

$ret = preg_replace('/(<li>|<\/li>)/', '', $res[0][0])

//输出res

//var_dump($res) 

echo $ret

最终输出的结果为:首页

在这个例子上题主所需要的值基本都可以用正则算法过滤出来

希望能帮到题主

如果可以,还请采纳

利用php解析html没有现成的方法,需要利用第三方插件PHP Simple HTML DOM Parser,它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素,功能十分强大。

1、首先要在程序的开始引入simple_html_dom.php这个文件

参考代码:include_once('simple_html_dom.php')

2、PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象

参考代码如下:

// Create a DOM object from a string

$html = str_get_html('<html><body>Hello!</body></html>')

// Create a DOM object from a URL

$html = file_get_html('')

// Create a DOM object from a HTML file

$html = file_get_html('test.htm')

得到DOM对象后就可以进行各种 *** 作了

// Find all anchors, returns a array of element objects

$ret = $html->find('a')

// Find (N)th anchor, returns element object or null if not found (zero based)

$ret = $html->find('a', 0)

// Find lastest anchor, returns element object or null if not found (zero based)

$ret = $html->find('a', -1)

// Find all <div>with the id attribute

$ret = $html->find('div[id]')

// Find all <div>which attribute id=foo

$ret = $html->find('div[id=foo]')


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12004963.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存