火车采集器是一款专业的互联网数据抓取、处理、分析,挖掘软件,
可以灵活迅速地抓取网页中大量非结构化的文本,图片等资源信息,
然后通过一系列的分析处理,准确挖掘出所需数据。
并可以选择发布到网站后台、导入数据库或者保存在本地Excel,Word等格式的文件中。
火车采集器历经十年的升级更新,积累了大量用户和良好口碑,是目前最受欢迎的网页数据采集软件。
火车采集器V9程序目录
-Configuration用户配置保存目录
-Synonym用户同义词保存目录
-CategoryDir模块网站栏目
--LoginConfig.ini登陆用户账号信息
--config.db3任务规则配置文件
-Data采集数据保存目录
-1、2、3等任务采集数据存储目录
-History_1,2,3任务采集网址库存储目录
-ModuleWeb发布模块及数据库发布模块目录
-Pluginsc#和PHP插件存储目录
-System系统文件目录
-Logs程序错误日志
--LocoySpider.exe火车采集器启动文件
--CodeEditor.exe源码编辑器
--DatabaseManager.exe数据库发布配置管理工具
--HttpPostGet.exeHTTP请求测试工具
--LocoyProxy.exe二级代理程序
--WebPostManager.exeWeb发布配置管理工具
--uninst.exe卸载程序
--UpdateToV9.exeV7,V8升级到V9程序
仔细看看教程,分析下自己错误的原因吧。今天给大家开堂讲火车头数据库导库模块的使用方法
教程准备:
1.火车头采集器
2.导库演示用我及其研究的sNews CMS程序
3.数据库管理权限 phpMyAdmin
开堂啦....
使用火车导入第一项做的事是建立数据库发布模块,
ps:当然建立数据库发布模块需要商业版才有的功能,或自直接购买数据库发布模块的编辑器。
另外火车头也提供了比较常用的程序数据库发布模块,大家可以直接下载使用就可以了。^^
编辑好数据库发布模块后下一步就是数据库发布模块配置。
在接着就是新建采集任务,把发布模式选择为数据库发布模式。
好吧,先来做数据库发布模块-
打开你的sNews CMS发布一条测试内容
填写好发布的各项内容
如 标题:title 内容:发布内容 描述 :Description 关键词:Keywords
发布成功!
然后转到你数据库管理工具phpMyAdmin,选择cms的数据库,然后进行导出数据库表。演示的sNews数据库需要导库的表是articles。当然不同的cms需要研究需要 *** 作的表是不同的,一般你发表几篇文章后再观察就可以找到。
还有的就是联动 *** 作,这个将在以后再给大家讲堂,呵呵简单的学起
导出表后,打开数据库发布模块编辑工具,同时打开导出的数据文件,可以用文本工具打开数据库就可以看到INSERT的语句,把这个语句直接复制到数据库发布模块编辑工具上面,然后按相应的标签修改。
模块名称:sNews 数据库类型我们演示的选择是mysql
添加数据表前缀,演示的sNews虽然没使用数据库表前缀^^
开始修改,一般ID字段是自增ID,确定不需要的可以删除掉。其它的一一对好字段修改好。
接着按自动获取 *** 作数据库表。最后写上说明,编辑好后保存模块,这样我的入库模块就完成了。...
开始配置数据库发布,
1.选择数据库类型 mysql
2.选择刚才建立的发布模块 sNews
3.设置登录数据库资料
4.测试连接,OK后保存 这里我们一般建议直接填写数据库名称,因为远程导库一般是刷不到数据库名称的!!
还有要填数据库前缀,但我们演示的是没有的,如果有一定要填上
新建任务,我演示用火车内置好的吧!一般的采集任务设置我们略过...
直接到采集标签那,主要演示给大家知道要做好对应发布模块的标签设置。
下一步到发布内容设置,启用方式三导入自定义数据库。最后设置成功发表项设置。
好了,大家开工吧开始采集,就可以享受数据库导库给你带来的快感啦.....
web发布模块根据你的网站系统版本选择,如果不是开源系统而是自己写的网站,则需要自己设计自己的发布模块。编码设置指的的网页编码,如utf8还是gbk。如果你对html完全不懂还是不要学火车头了,这个有一定的难度的。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)