如何提高mysql查询速度_随笔

在已有的 MySQL 服务器之上使用 Apache Spark （无需将数据导出到 Spark 或者 Hadoop 平台上），这样至少可以提升 10 倍的查询性能。使用多个 MySQL 服务器（复制或者 Percona XtraDB Cluster）可以让我们在某些查询上得到额外的性能提升。你也可以使用 Spark 的缓存功能来缓存整个 MySQL 查询结果表。

思路很简单：Spark 可以通过 JDBC 读取 MySQL 上的数据，也可以执行 SQL 查询，因此我们可以直接连接到 MySQL 并执行查询。那么为什么速度会快呢？对一些需要运行很长时间的查询（如报表或者BI），由于 Spark 是一个大规模并行系统，因此查询会非常的快。MySQL 只能为每一个查询分配一个 CPU 核来处理，而 Spark 可以使用所有集群节点的所有核。在下面的例子中，我们会在 Spark 中执行 MySQL 查询，这个查询速度比直接在 MySQL 上执行速度要快 5 到 10 倍。

另外，Spark 可以增加“集群”级别的并行机制，在使用 MySQL 复制或者 Percona XtraDB Cluster 的情况下，Spark 可以把查询变成一组更小的查询（有点像使用了分区表时可以在每个分区都执行一个查询），然后在多个 Percona XtraDB Cluster 节点的多个从服务器上并行的执行这些小查询。最后它会使用map/reduce 方式将每个节点返回的结果聚合在一起形成完整的结果。

首先我们做一个模拟，执行以下的sql，其中有如下图数据：

我把执行结果按照表格如下展示：

分析：

在会话1当中，只有当会话1的事务提交后，才能查到最终会话2更改的数据。

在会话2当中，开启事务后更新数据，之后查询发现数据变成了17。

针对上面的现象我们进行个原理分析:

实际上产生上述显现是因为InnoDB采用的MVCC（多版本并发控制），其中针对每条数据会有它自己的事务id，以及一个最大事务id。针对事务中数据每次修改，会产生不同的版本。

1）假设开始id = 2的数据，其事务txid = 1000；

2）当会话1开始，此时txid变成了1001，而会话2开启，txid又变成了1002，同理会话3会变成1003，此时都生成了不同版本的快照。

3）会话1在事务当中去读取时候，采用了快照读的方式，即拿到一个1001的事务id，此时只会读取小于等于自己版本的数据，所以在事务中最终只能拿到值为17的数据。

4）会话2在更新数据的时候，采用的当前读的方式，即对数据增加X锁，获取最新的事务id，读取最新的版本数据。所以在更新之前，就读取到了age的年龄是16，之后在进行+1，得到17.

总结一下：

快照读 解决了幻读的问题，即多次读取数据不一致的问题。

update、insert、delete都会执行 当前读 ，防止并发更新数据导致数据错误，此过程或添加X锁。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7277934.html

如何提高mysql查询速度

发表评论

评论列表（0条）