火车采集器是什么 火车采集器程序文件说明

火车采集器是什么 火车采集器程序文件说明,第1张

什么是火车采集器?

火车采集器是一款专业的互联网数据抓取、处理、分析,挖掘软件,

可以灵活迅速地抓取网页中大量非结构化的文本,图片等资源信息,

然后通过一系列的分析处理,准确挖掘出所需数据。

并可以选择发布到网站后台、导入数据库或者保存在本地Excel,Word等格式的文件中。

火车采集器历经十年的升级更新,积累了大量用户和良好口碑,是目前最受欢迎的网页数据采集软件。

火车采集器V9程序目录

-Configuration用户配置保存目录

-Synonym用户同义词保存目录

-CategoryDir模块网站栏目

--LoginConfig.ini登陆用户账号信息

--config.db3任务规则配置文件

-Data采集数据保存目录

-1、2、3等任务采集数据存储目录

-History_1,2,3任务采集网址库存储目录

-ModuleWeb发布模块及数据库发布模块目录

-Pluginsc#和PHP插件存储目录

-System系统文件目录

-Logs程序错误日志

--LocoySpider.exe火车采集器启动文件

--CodeEditor.exe源码编辑器

--DatabaseManager.exe数据库发布配置管理工具

--HttpPostGet.exeHTTP请求测试工具

--LocoyProxy.exe二级代理程序

--WebPostManager.exeWeb发布配置管理工具

--uninst.exe卸载程序

--UpdateToV9.exeV7,V8升级到V9程序

仔细看看教程,分析下自己错误的原因吧。

今天给大家开堂讲火车头数据库导库模块的使用方法

教程准备:

1.火车头采集器

2.导库演示用我及其研究的sNews CMS程序

3.数据库管理权限 phpMyAdmin

开堂啦....

使用火车导入第一项做的事是建立数据库发布模块,

ps:当然建立数据库发布模块需要商业版才有的功能,或自直接购买数据库发布模块的编辑器。

另外火车头也提供了比较常用的程序数据库发布模块,大家可以直接下载使用就可以了。^^

编辑好数据库发布模块后下一步就是数据库发布模块配置。

在接着就是新建采集任务,把发布模式选择为数据库发布模式。

好吧,先来做数据库发布模块-

打开你的sNews CMS发布一条测试内容

填写好发布的各项内容

如 标题:title 内容:发布内容 描述 :Description 关键词:Keywords

发布成功!

然后转到你数据库管理工具phpMyAdmin,选择cms的数据库,然后进行导出数据库表。演示的sNews数据库需要导库的表是articles。当然不同的cms需要研究需要 *** 作的表是不同的,一般你发表几篇文章后再观察就可以找到。

还有的就是联动 *** 作,这个将在以后再给大家讲堂,呵呵简单的学起

导出表后,打开数据库发布模块编辑工具,同时打开导出的数据文件,可以用文本工具打开数据库就可以看到INSERT的语句,把这个语句直接复制到数据库发布模块编辑工具上面,然后按相应的标签修改。

模块名称:sNews 数据库类型我们演示的选择是mysql

添加数据表前缀,演示的sNews虽然没使用数据库表前缀^^

开始修改,一般ID字段是自增ID,确定不需要的可以删除掉。其它的一一对好字段修改好。

接着按自动获取 *** 作数据库表。最后写上说明,编辑好后保存模块,这样我的入库模块就完成了。...

开始配置数据库发布,

1.选择数据库类型 mysql

2.选择刚才建立的发布模块 sNews

3.设置登录数据库资料

4.测试连接,OK后保存 这里我们一般建议直接填写数据库名称,因为远程导库一般是刷不到数据库名称的!!

还有要填数据库前缀,但我们演示的是没有的,如果有一定要填上

新建任务,我演示用火车内置好的吧!一般的采集任务设置我们略过...

直接到采集标签那,主要演示给大家知道要做好对应发布模块的标签设置。

下一步到发布内容设置,启用方式三导入自定义数据库。最后设置成功发表项设置。

好了,大家开工吧开始采集,就可以享受数据库导库给你带来的快感啦.....

web发布模块根据你的网站系统版本选择,如果不是开源系统而是自己写的网站,则需要自己设计自己的发布模块。编码设置指的的网页编码,如utf8还是gbk。如果你对html完全不懂还是不要学火车头了,这个有一定的难度的。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6660038.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存