数据采集系统有哪几种采集方式,各自有什么特点

数据采集系统有哪几种采集方式,各自有什么特点,第1张

1、设备类:

指从传感器和其它待测设备等模拟和数字被测单元中自动采集信息的过程。数据采集系统是结合基于计算机的测量软硬件产品来实现灵活的、用户自定义的测量系统。比如条码机、扫描仪等都是数据采集工具(系统)。

2、网络类:

用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网络的一种信息化工具。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容,也可以对数据进行处理。

数据采集系统包括了:可视化的报表定义、审核关系的定义、报表的审批和发布、数据填报、数据预处理、数据评审、综合查询统计等功能模块。

通过信息采集网络化和数字化,扩大数据采集的覆盖范围,提高审核工作的全面性、及时性和准确性;最终实现相关业务工作管理现代化、程序规范化、决策科学化,服务网络化。

扩展资料

数据采集系统特点:

a、数据采集通用性较强。不仅可采集电气量,亦可采集非电气量。电气参数采集用交流离散采样,非电气参数采集采用继电器巡测,信号处理由高精度隔离运算放大器AD202JY调理,线性度好,精度高。

b、整个系统采用分布式结构,软、硬件均采用了模块化设计。数据采集部分采用自行开发的带光隔离的RS-485网,通信效率高,安全性好,结构简单。

后台系统可根据实际被监控系统规模大小及要求,构成485网、Novell网及WindowsNT网等分布式网络。由于软、硬件均为分布式、模块化结构,因而便于系统升级、维护,且根据需要组成不同的系统。

c、数据处理在WindowsNT平台上采用VisualC++语言编程,处理能力强、速度快、界面友好,可实现网络数据共享。

d、整个系统自行开发,符合我国国情。对发电厂原有系统的改动很小,系统造价较低,比较适合中小型发电厂技术改造需要。

参考资料来源:百度百科-数据采集系统

有更加成熟的一种爬虫脚本语言,而非框架。是通用的爬虫软件ForeSpider,内部自带了一套爬虫脚本语言。

从一个专业C++程序猿的角度说,网上流传的各种Java爬虫,Python爬虫,Java需要运行于C++开发的虚拟机上,Python只是脚本语言,采集效率和性能如何能与强大的C++相提并论?C++直接控制系统的底层,对内存空间的控制和节省都是其他语言无法竞争的。首先,forespider的开发语言是C++,而且C++几乎没有现成的框架可以用,而火车采集器是用的C#。先从业界水平和良心来说,这个软件可以做到从底层到上层都是他们的技术人员自己写的,而非运用现成的框架结构。

其次,因为抓取金融行业的数据,数据量大,动态性强,而采集对象一般反爬虫策略又很严格。所以,专门建立团队开发不现实。请外包人员开发太贵。买现成的软件,要考虑性价比。因为很多数据需要登录,需要验证码,是JS生成的数据,是ajax,是https协议,有加密的key,有层层的验证机制等等,分析市面上所有找得到的爬虫软件,没有找到其他一家可以完全把我们列表上的网站采集下来的软件。forespider功能强大,这是很重要的一点。

第三,forespider在台式机上运行一天可以采400万条数据,在服务器上一天可以采8000万条数据。这样一来,数据更新速度明显比以前快了几十倍。从前抓一个7500万的网站需要好几个月,等抓完数据早都变化的不成样子了,这是很多爬虫的痛处。但是现在的更新速度只有两三天。forespider的性能强大,这也是非常好的一点。

第四,其实完全可视化的采集也不需要计算机专业的。大致学习了之后就可以上手采。而且forespider关于数据的管理做的很好。一是软件可以集成数据库,在采集之前就可以建表。二是数据可以自动排重,对于金融这样数据更新要求很高的行业,就特别合适。

通用的采集软件都可以进行采集数据的发布,介绍三款软件,自己选择:

网络神采 共享版 采集规则自定义,可采集任意网站数据。可发布access、mssql、mysql,付费后还可发布到oracle。但网络神采共享版对采集任务数据由最大限制,好像是只能采集300条数据,用起来很不爽,其他的版本价格个人认为偏高。

火车头 免费版 采集规则配置起来略微复杂,也可发布access、sqlserver、mysql及oracle。但免费版受限较大,此方面可以参看http://www.locoy.com/product/buy.html 进行版本功能比较。

Soukey采摘 唯一一款开源免费的软件,功能与火车头网络神采类似 ,支持采集规则自定义,在此方面与火车头网络神采类似,数据库发布支持Access、sqlserver及Mysql。如果具备一定的技术基础,建议使用soukey采摘,灵活不受限制,可以针对自己的网站规则进行修正。源代码可在https://sourceforge.net/projects/soukeygetdata/ 下载。

我个人采集经验,采集的数据一般很难满足数据库要求规则,一般都需要进行数据加工,或者采用web方式发布数据。所以,建议选择可以带有一定数据加工的采集软件,会很方便的。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6726513.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存