javascript实现:
toplocationhref 顶级窗口的地址
thislocationhref 当前窗口的地址
复制代码
PHP实现
复制代码
#测试网址: >
先把原站的首页所有链接爬一遍,可通过正则表达式提取页面HTML源码里的链接,要保证可用的话需要提取的链接应包含:超级链接(a 标签)、Link标签链接、script的src属性的链接、地址等,属于资源类的链接(如link标签的链接、img的src),应将资源转存下来,链接提取后保存在一个数组或者数据库里。
按照链接库爬内页和资源,提取内页的链接,保存内页用到的资源,与爬首页时的链接库对比,把相同的剔除掉,避免重复爬。在把剩下的链接追加保存到链接库。
重复爬行,直到链接库里的链接全部爬完。
如果你要
和
之间的所有源码,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的
标签中的内容,可以用preg_match_all //提取所有代码 $pattern = '/
(+)
/is'; preg_match($pattern, $string, $match); //$match[0] 即为
和
之间的所有源码 echo $match[0]; //然后再提取
之间的内容 $pattern = '/(+)li>/is'; preg_match_all($pattern, $match[0], $results); $new_arr=array_unique($results[0]); foreach($new_arr as $kkk){ echo $kkk; }
<php
$str = <<<str
<th>1</th>
<td class="key"><a href="网址1" target="_blank">你要的地址1</a></td>
<th>2</th>
<td class="key"><a href="网址2" target="_blank">你要的地址2</a></td>
<th>3</th>
<td class="key"><a href="网址3" target="_blank">你要的地址3</a></td>
<th>4</th>
<td class="key"><a href="网址4" target="_blank">你要的地址4</a></td>
<th>5</th>
<td class="key"><a href="网址5" target="_blank">你要的地址5</a></td>
str;
$p = '#<td class="key"><a href="()" target="_blank">()</a></td>#iUs';
preg_match_all($p,$str,$ar);
print_r($ar[0]);
>
$ar[0] 的所有值就是你想要的地址了 测试过 没问题
我写好了,用Dreamweaver调试过,可以匹配。
先用下面正则提取需要的代码段:
Draw Result+>(\d{1,2})</td>+>(\d{1,2})</td>+>(\d{1,2})</td>+>(\d{1,2})</td>+>(\d{1,2})</td>+>(\d{1,2})</td>再用正则替换,把该内容中除了数字以外的代码去除:
替换成$1,$2,$3,$4,$5,$6 即可得到 4,7,8,33,36,43
以上就是关于php如何获取网址中的参数全部的内容,包括:php如何获取网址中的参数、PHP如何遍历网站所有的url,麻烦给个思路,谢谢、用PHP获取网页部分数据等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)