火车头9.7.1怎么添加到web里面

火车头9.7.1怎么添加到web里面,第1张

1、运行火车头软件,点击发布到发布窗口界面

2、点击添加,依次选择发布接口,选择网站编码、填写后台路李丛径、(因为是免登陆接口)选择不需要登录&http请求,然后获取列表看看是否成功,成功后请保持配置。

(注意:如果无法获取列表说明没有配置成功,检测接口文件是否上传,后台路径是否正确等)

3、如果你需要同时发布到多个网站,请重复2 *** 作,原则上可以发布N个。

4、配置完发布接口后回到火车头界面,双击你要发布的采集规则,进入采集规则 编辑任务窗口,切换到第三步:发布内容配置

5、点击 启用 Web在线发布到网站,然后添加发布配置,在d出Web发布配置窗口选择你你的发布配置,点击添加,多个网站发布可以多选

6、双击你添加的网站发布,点键悉击获取列表 绑定你要发布到网站的指定栏目的栏目ID,保存规则,到此你的采集规则发布到网站已经配置好了

7、如果你要一条采集规则多个网站发布就重复稿扰乎第6步,原则上可以发布N个站。

“我采集一个网页的地亮尺址,起始找的是一个层,终止也找了一个层 这样不行啊...如果没有数字的网址怎么采集呢!如某个网址是list_50.html ...上图 才... ”

----------------------------

有些网站的列表页翻页参数中,第一个参数是无效的,利用数值变化就无法访问列表页的第一页。

我不知道在火车头里面怎样解决这个问题的。在熊猫采集里面是可以忽略这个问题的,只需要鼠标选择列表页中指向下一页的链接,就能翻页访问。因为熊猫使用的是机器训练的采集设置薯老方式。不需要用户手工设数键升置这些。

少数没有下一页的列表页中,遇到这种情况,可以使用参数列表方式解决。你可以在火车采集器里面找找是否有“参数列表”的翻页方式。

有些采集软件中,可以直接同时输入多个列表页地址。这样也就不必去设置翻页参数,也很简单。熊猫中不支持这种方式,不知道火车采集器是否支持。如果支持,你可以直接输入多个列表页地址,换行区分即可。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11979370.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存