如何批量提取本地HTML里的图片或图片超链接

如何批量提取本地HTML里的图片或图片超链接,第1张

用工具吧,比如offline explorer,只要设定好目标网站,下载哪些内容,下载到哪个层级,就可以等着收获了。

当然,工具对于带有程序(如ASP)的网页处理会有些问题,但对于HTML网页没问题。

供参考。

用Replace Pioneer可以这样完成:

先用单个文件做测试:

1 ctrl-o打开文本文件

2 ctrl-h打开Replace窗口

在Search for pattern输入[<img src="()"]不带左右的方括号

在Replace with pattern输入[\1\n]不带左右的方括号。

去掉Print Unmatch Unit选项,把其他不需要的内容去掉。

3 点击Replace,即完成地址的提取。

对多个文件的提取:

1 ctrl-h打开Replace窗口

在Search for pattern输入[<img src="()"]不带左右的方括号。

在Replace with pattern输入[\1\n]不带左右的方括号。

去掉Print Unmatch Unit选项,把其他不需要的内容去掉。

把右下角Output File左边的">"号选成">> Append"表示追加模式,所有的输出将追加到一个文件中

2 点击Batch按钮打开Batch Runner窗口

3 点击Search Files选择待处理的多个html文件

4 选择Set output filename,把${FILENAME}改为固定的输出文件名,比如outputtxt,那么所有的结果将追加到outputtxt中。

5 点击Batch Replace即将所有的输出写入outputtxt。

注:如果待处理的不是html文件,而是网页地址(保证网页中直接有需要的链接),可以首先把网页地址保存在一个文件比如atxt中(每行必须以>

以上就是关于如何批量提取本地HTML里的图片或图片超链接全部的内容,包括:如何批量提取本地HTML里的图片或图片超链接、怎样批量提取大量html,txt等文档中的图片地址Replace Pioneer、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10071878.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存