dedecms采集规则怎么写?满意加50分

dedecms采集规则怎么写?满意加50分,第1张

用软件采集。dedecms 5.1版具体步骤这样:节点名称随便写自己记住就行了,编码按照采集网页自己定制,然后其他没特殊要求默认就好了,然后是分页列表页面。 采集列表获取,节点名称随便写自己记住就行了,编码按照采集网页自己定制,然后其他没特殊要求默认就好了,然后是分页列表页面。

采集列表获取规则:

来源网址获取方式:自己选择这里我选的第一个

分页变量起始值:分页的变量这个应该明白吧大家。

来源网址:根据页面的分页列表url形式就好了,截图里有大家可以看看!

文章网址需包含:这个就是说列表页每个链接文章的url里面都包含的那字符串

网址不能包含:一般不用写

其他留空就好了,好了下面介绍采集内容页面的填写。”<div id="content" class="common"><h1>漂亮的色彩溶解渐变插画图片</h1><p id="meta">上传时间:2009-01-07 作者:网络 来源:网络</p><iframe marginwidth="0" marginheight="0" "

大家截取标题的话就是截取

开始无重复HTML:

<div id="content" class="common"><h1>

结尾无重复HTML:

</h1><p id="meta">

就是开始和结尾别重复了就行了,然后符合每个页面的代码规则就好了。(截图是比较早的采集页面,原网站如果有改动请自己改动,图作为参考而已)

然后下面的都按照采集标题的规则去设置就好了!

软件程序的获取:

大家可以从百度中搜索“火车头采集器”,并进入对应官方来获取程序的最新版本下载地址。当然也可以从小编所提供的网盘地址中获取最新版本程序:

请点击输入图片描述

请点击输入图片描述

2

安装并运行“火车头采集器”程序,在d出的登陆界面中直接点击“登陆”按钮就可以以免费版身份登陆。

请点击输入图片描述

3

在程序主界面中,点击“新建”下拉箭头,从中选择“任务”项。

请点击输入图片描述

4

在d出的窗口中,输入“任务名”,同时点击“起始网址”栏目右侧的“添加”按钮。

请点击输入图片描述

5

接下来就极为重要的一步,就是对要进行采集的网站进行分板,对所采取的网站中各片文章的URL进行综合分析并找出规律,最后按如图进行填写。

请点击输入图片描述

6

然后切换至“第二步:采集内容规则”选项卡中,我们需要对网页内容进行分板。在此以“搜狗浏览器”为例,右击要进行分析的网页,从d出的菜单中选择“审查元素”项。

请点击输入图片描述

7

在“开发式模式”界面中,点击“选择页面中的一个元素去透视”按钮,接着点击“标题”内容,此时就可以在“开发者”窗口中显示标题所对应的标签,此例为“h2"。

请点击输入图片描述

8

接下来在”采集内容规则“界面中,点击“添加”按钮来添加“标题”项,或者直接双击“标题”项进行修改。在d出的界面中,勾选”前后截取“,将设置前后辍分别为"<h2>“、”</h2>".

请点击输入图片描述

9

利用同样的方法添加其它采集内容的规则。

切换至“第三步:发布内容设置”选项卡,勾选“启用 方式二”,并进行如图设置。

请点击输入图片描述

10

最后从任务列表中,勾选要采集的内容,点击“开始”按钮就可以按规则采集网站中的网页内容啦。

请点击输入图片描述

如果还有啥问题,请留言或者私信,如果回答的还算可以,请列为最佳答案

你可以先用八爪鱼把图片的URL地址先下下来,具体的 *** 作步骤是,进入软件后,先设置一个任务名称,然后在设置工作流程中,在浏览器内打开你要采集或抓取的网址,然后点击要采集的图片建立元素列表,如果有多页,还需要建立一个翻页循环,建立元素列表后,再点击元素列表中的任何一个元素,设置采集字段,就是你要采集的图片URL,选择完成后,运行就可以抓取到图片URL了,然后再用八爪鱼的批量图片下载工具转换一下,就可以获得图片啦!


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11767184.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存