MySQL按月自动创建分区表(千万级大表优化)_随笔

对用户来说，分区表是一个独立的逻辑表，但是底层由多个物理子表组成，实现分区的代码实际上是通过对一组底层表的对象封装，但对SQL层来说是一个完全封装底层的黑盒子。

MySQL实现分区的方式也意味着索引也是按照分区的子表定义， 没有全局索引 。

分区的意思是指将同一表中不同行的记录分配到不同的物理文件中 ，几个分区就有几个.idb文件。MySQL数据库的分区是局部分区索引，一个分区中既存了数据，又放了索引。也就是说，每个区的聚集索引和非聚集索引都放在各自区的（不同的物理文件）。

1、可以让单表 存储更多的数据 。

2、 分区表的数据更容易维护 ，可以通过删除与那些数据有关的分区，更容易删除数据，也可以增加新的分区来支持新插入的数据。另外，还可以对一个独立分区进行优化、检查、修复等 *** 作。

3、部分查询能够从查询条件确定只落在少数分区上， 查询速度会很快 。

4、通过跨多个磁盘来分散数据查询，来 获得更大的查询吞吐量 。

要使定时事件起作用，MySQL的常量GLOBAL event_scheduler必须为on或者是1。

1、查看scheduler的当前状态：

2、修改scheduler状态为打开(0:off , 1:on)：

3、临时打开定时器(四种方法)：

4、永久生效的方法，修改配置文件my.cnf

5、临时开启某个事件

6、临时关闭某个事件

在统计数据的需求中很容易出现按照天来统计数据的场景，有时某一列的维度在那天并没有产生数据，但是又没有一列是可以确保每天都是有数据的，由于mysql中并没有fulljoin这样的关联方式，在这种情况下关联查询就有些费劲，解决的办法也是多种多样，毕竟条条大路通罗马嘛，其他的就不说了，这里介绍一种相对方便的方法。

产生一个足够长的时间列，这个列要能够包含想要统计的所有日期。这个思路的实现很泛，可以创建一个日期的临时表，然后将想要查的日期插入，抛开创建表比较麻烦之外，一般在职能比较完善的公司，生产环境创建表或者修改数据是需要交给专门的DBA去 *** 作的，各种流程。。。相对这个较简单的一种方式就是创建存储过程，然后产生时间列，这也是一种解决办法。

我的思路是先定义一个时间变量并初始化，然后和某个数据足够多的表关联查询获取时间列，这个表一般选取某张要查的表即可，数据条数只要超过需要查询的条数即可，足够即可，太多就是浪费，降低查询效率。

比如说我要查询2018-01-10到2018-01-20每天的数据，那么就可以写成

其中，cdate是我定义的一个时间变量，初始化的值是2018-01-09，因为在外面那部分执行之后值已经加1了，已经不是2018-01-10了；data_t是我关联产生记录的实体表，这个表只有一个要求，就是能帮我们产生足够的时间列条数，后面的limit 15是帮助我产生15条时间记录，可以换成其他条件；生成的t0其实就是15条全为2018-01-09的记录，外面的查询在每扫描一条t0的记录就会加1天，这样就会产生连续的时间列；WHERE后面是最终查询的截止条件，换成其他的也可以。

关联其他表举例：

查询从2018-01-10到当前日期每天的统计数据

通过上面的例子我想大部分人应该可以灵活变化了，比如查询多少天内每天的统计数据，某几个月内每月的统计数据等等，通过修改上面给的例子里面的sql完全可以做到，可以说这种思路就是个‘万能模板’，希望本文能够帮到大家。

Mysql按月统计数据,当天没有数据补0

CREATE TABLE num (i int)-- 创建一个表用来储存0-9的数字

INSERT INTO num (i) VALUES (0), (1), (2), (3), (4), (5), (6), (7), (8), (9)-- 生成0-9的数字，方便以后计算时间

CREATE TABLE `calendar ` (

`datelist` varchar(255) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7110447.html

MySQL按月自动创建分区表(千万级大表优化)

发表评论

评论列表（0条）