mysql 源数据 怎么做数据仓库

mysql 源数据 怎么做数据仓库,第1张

Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/group by之类),infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑层加上它自身的优化器。

Infobright特征

优点:

大数据量查询性能强劲、稳定:百万、千万、亿级记录数条件下,同等的SELECT查询语句,速度比MyISAM、InnoDB等普通的MySQL存储引擎快5~60倍。高效查询主要依赖特殊设计的存储结构对查询的优化,但这里优化的效果还取决于数据库结构和查询语句的设计。

存储数据量大:TB级数据大小,几十亿条记录。数据量存储主要依赖自己提供的高速数据加载工具(百G/小时)和高数据压缩比(>10:1)

高数据压缩比:号称平均能够达到 10:1 以上的数据压缩率。甚至可以达到40:1,极大地节省了数据存储空间。高数据压缩比主要依赖列式存储和 patent-pending 的灵活压缩算法.

基于列存储:无需建索引,无需分区。即使数据量十分巨大,查询速度也很快。用于数据仓库,处理海量数据没一套可不行。不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜 索。

快速响应复杂的聚合类查询:适合复杂的分析性SQL查询,如SUM, COUNT, AVG, GROUP BY

mysql配置ODBC数据源的方法(以win10为例说明):

1 打开【开始菜单】——【控制面板】,若在窗口中能找到【管理工具】选项则单击管理工具;若不能找到则在窗口右上角的“查看方式”下拉框中下拉选择“小图标”或者“大图标”,然后就可出现【管理工具】选项了,单击进入。

2 在d出的窗口中双击选择【数据源(ODBC)】快捷方式,在【用户DSN】选项卡中单击【添加】按钮,然后选择“MySQL ODBC 5.3 Unicode Driver”。

3 填写配置信息:前两个选项可根据项目功能信息填写;然后按具体情况填写TCP/IP Server和Port;然后是MySQL用户名、密码、数据库名称。

设置成功。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7270013.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存