时序数据库是什么?解决什么问题的?主要应用那些行业?

时序数据库是什么?解决什么问题的?主要应用那些行业?,第1张

什么是时序数据

时序数据库全称为时间序列数据库。时间序列数据库主要用于指处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。主要用于存储周期性的采集各种实时监控信息。

特点

垂直写,水平读

数据点写入分散,且数据量巨大

热点数据明显

序数据库英文全称为Time Series Database,简称TSDB,是以时间为索引的规律性时间间隔记录的数据库。时序数据库采用特殊数据存储方式,极大提高了时间相关数据的处理能力,相对于关系型数据库它的存储空间减半,查询速度极大的提高。

一、时序数据库是什么

时序数据库全称为时间序列数据库。时间序列数据库指主要用于处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。

时间序列数据主要由电力行业、化工行业、气象行业、地理信息等各类型实时监测、检查与分析设备所采集、产生的数据,这些工业数据的典型特点是:产生频率快(每一个监测点一秒钟内可产生多条数据)、严重依赖于采集时间(每一条数据均要求对应唯一的时间)、测点多信息量大(常规的实时监测系统均有成千上万的监测点,监测点每秒钟都产生数据,每天产生几十GB的数据量)。

二、时序数据库的特点

1、有效处理庞大数据。

2、对重复的部分,Informix TimeSeries只保持一份数据。

3、节省空间50%,有效降低I/O。

4、主键索引更有效。

5、时间序列表头分离的特性不浪费空间。

三、时序数据库和关系型数据库的区别

1、数据压缩情况

关系型数据库将它们的数据按行存储在磁盘上,不同的数据类型彼此相邻,这限制了可以使用什么类型的压缩算法以及可以压缩多少数据。

而时序数据库通常以相同类型的数据点彼此相邻的方式存储数据,这样的话可以使用最佳压缩算法,大大节省了存储成本。

2、数据库架构

关系型数据库底层是定义好模式的,所以对于表本身,不管是修改还是删除某一列,都会影响到数据库的模式,在底层相当于要进行”数据库迁移“。

而时序数据库往往是无模式的,允许快速轻松地添加新字段。

3、可用性和冗余

关系型数据库可以通过集群存储的方式提供高可用性,但它们容易受到网络可用性的影响,如果连接断开,数据收集将停止。

而时序数据库通过收集器的冗余可以确保良好的可用性,时序数据库一般带有存储转发技术,如果发生中断,该技术会在收集器处缓冲数据,当服务器自动重连时,缓冲区最终会同步上传,确保不会丢失数据。

4、数据安全

数据库被黑客和病毒攻击的事件频繁发生,中q的大多数是知名的关系数据库,常见的攻击比如有:SQL注入。

而时序数据库一般不允许通过标准接口插入、更新或删除数据,此外,时序数据库会跟踪所有更改,包括使用访问、配置、安全违规和系统警报。

截面数据:描述的是现象在某一时刻的变化情况。时间序列数据:描述的是现象随时间而变化的情况。

对某个统计指数在不同时期进行观测,将得到的数据按时间先后次序进行排列,这样得到的统计数据称为时间序列数据。每月的销售额、每季度的进口额、每年末的存款余额等都是时间序列数据。与此不同,若某个指标在不同的个体上进行观测,则得到该指标的一组横截面数据。

目的

时间序列分析的目的是通过找出样本内时间序列的统计特性和发展规律性,构建时间序列模型,进行样本外预测。在建立模型时要求时间序列是平稳的,但实际进行分析的时间序列尤其是来自经济领域的时间序列大多是非平稳的。

这些非平稳的时间序列往往具有某些典型的数据特征。在建立模型时,往往根据序列表现出的数据特征考虑合适的时间序列模型。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6422456.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-21
下一篇 2023-03-21

发表评论

登录后才能评论

评论列表(0条)

保存