MySQL数据库存储引擎详解_随笔

存储引擎是什么？

MySQL中的数据用各种不同的技术存储在文件(或者内存)中这些技术中的每一种技术都使用不同的存储机制索引技巧锁定水平并且最终提供广泛的不同的功能和能力通过选择不同的技术你能够获得额外的速度或者功能从而改善你的应用的整体功能

例如如果你在研究大量的临时数据你也许需要使用内存存储引擎内存存储引擎能够在内存中存储所有的表格数据又或者你也许需要一个支持事务处理的数据库(以确保事务处理不成功时数据的回退能力)

这些不同的技术以及配套的相关功能在MySQL中被称作存储引擎(也称作表类型) MySQL默认配置了许多不同的存储引擎可以预先设置或者在MySQL服务器中启用你可以选择适用于服务器数据库和表格的存储引擎以便在选择如何存储你的信息如何检索这些信息以及你需要你的数据结合什么性能和功能的时候为你提供最大的灵活性

选择如何存储和检索你的数据的这种灵活性是MySQL为什么如此受欢迎的主要原因其它数据库系统(包括大多数商业选择)仅支持一种类型的数据存储遗憾的是其它类型的数据库解决方案采取的一个尺码满足一切需求的方式意味着你要么就牺牲一些性能要么你就用几个小时甚至几天的时间详细调整你的数据库使用MySQL 我们仅需要修改我们使用的存储引擎就可以了

在这篇文章中我们不准备集中讨论不同的存储引擎的技术方面的问题(尽管我们不可避免地要研究这些因素的某些方面) 相反我们将集中介绍这些不同的引擎分别最适应哪种需求和如何启用不同的存储引擎为了实现这个目的在介绍每一个存储引擎的具体情况之前我们必须要了解一些基本的问题

如何确定有哪些存储引擎可用

你可以在MySQL(假设是MySQL服务器以上版本)中使用显示引擎的命令得到一个可用引擎的列表

这个表格显示了可用的数据库引擎的全部名单以及在当前的数据库服务器中是否支持这些引擎

对于MySQL 以前版本可以使用mysql>show variables like have_% (显示类似 have_% 的变量):

你可以通过修改设置脚本中的选项来设置在MySQL安装软件中可用的引擎如果你在使用一个预先包装好的MySQL二进制发布版软件那么这个软件就包含了常用的引擎然而需要指出的是如果你要使用某些不常用的引擎特别是CSV RCHIVE(存档)和BLACKHOLE(黑洞)引擎你就需要手工重新编译MySQL源码

使用一个指定的存储引擎

你可以使用很多方法指定一个要使用的存储引擎最简单的方法是如果你喜欢一种能满足你的大多数数据库需求的存储引擎你可以在MySQL设置文件中设置一个默认的引擎类型（使用storage_engine 选项）或者在启动数据库服务器时在命令行后面加上 default storage engine或 default table type选项

更灵活的方式是在随MySQL服务器发布同时提供的MySQL客户端时指定使用的存储引擎最直接的方式是在创建表时指定存储引擎的类型向下面这样:

CREATE TABLE mytable (id int title char( )) ENGINE = INNODB

你还可以改变现有的表使用的存储引擎用以下语句:

ALTER TABLE mytable ENGINE = MyISAM

然而你在以这种方式修改表格类型的时候需要非常仔细因为对不支持同样的索引字段类型或者表大小的一个类型进行修改可能使你丢失数据如果你指定一个在你的当前的数据库中不存在的一个存储引擎那么就会创建一个MyISAM(默认的)类型的表

各存储引擎之间的区别

为了做出选择哪一个存储引擎的决定我们首先需要考虑每一个存储引擎提供了哪些不同的核心功能这种功能使我们能够把不同的存储引擎区别开来我们一般把这些核心功能分为四类:支持的字段和数据类型锁定类型索引和处理一些引擎具有能过促使你做出决定的独特的功能我们一会儿再仔细研究这些具体问题

字段和数据类型

虽然所有这些引擎都支持通用的数据类型例如整型实型和字符型等但是并不是所有的引擎都支持其它的字段类型特别是BLOG（二进制大对象）或者TEXT文本类型其它引擎也许仅支持有限的字符宽度和数据大小

这些局限性可能直接影响到你可以存储的数据同时也可能会对你实施的搜索的类型或者你对那些信息创建的索引产生间接的影响这些区别能够影响你的应用程序的性能和功能因为你必须要根据你要存储的数据类型选择对需要的存储引擎的功能做出决策

锁定

数据库引擎中的锁定功能决定了如何管理信息的访问和更新当数据库中的一个对象为信息更新锁定了在更新完成之前其它处理不能修改这个数据(在某些情况下还不允许读这种数据)

锁定不仅影响许多不同的应用程序如何更新数据库中的信息而且还影响对那个数据的查询这是因为查询可能要访问正在被修改或者更新的数据总的来说这种延迟是很小的大多数锁定机制主要是为了防止多个处理更新同一个数据由于向数据中插入信息和更新信息这两种情况都需要锁定你可以想象多个应用程序使用同一个数据库可能会有很大的影响

不同的存储引擎在不同的对象级别支持锁定而且这些级别将影响可以同时访问的信息得到支持的级别有三种:表锁定块锁定和行锁定支持最多的是表锁定这种锁定是在MyISAM中提供的在数据更新时它锁定了整个表这就防止了许多应用程序同时更新一个具体的表这对应用很多的多用户数据库有很大的影响因为它延迟了更新的过程

页级锁定使用Berkeley DB引擎并且根据上载的信息页( KB)锁定数据当在数据库的很多地方进行更新的时候这种锁定不会出现什么问题但是由于增加几行信息就要锁定数据结构的最后 KB 当需要增加大量的行也别是大量的小型数据就会带来问题

行级锁定提供了最佳的并行访问功能一个表中只有一行数据被锁定这就意味着很多应用程序能够更新同一个表中的不同行的数据而不会引起锁定的问题只有InnoDB存储引擎支持行级锁定

建立索引

建立索引在搜索和恢复数据库中的数据的时候能够显著提高性能不同的存储引擎提供不同的制作索引的技术有些技术也许会更适合你存储的数据类型

有些存储引擎根本就不支持索引其原因可能是它们使用基本表索引(如MERGE引擎)或者是因为数据存储的方式不允许索引(例如FEDERATED或者BLACKHOLE引擎)

事务处理

事务处理功能通过提供在向表中更新和插入信息期间的可靠性这种可靠性是通过如下方法实现的它允许你更新表中的数据但仅当应用的应用程序的所有相关 *** 作完全完成后才接受你对表的更改例如在会计处理中每一笔会计分录处理将包括对借方科目和贷方科目数据的更改你需要要使用事务处理功能保证对借方科目和贷方科目的数据更改都顺利完成才接受所做的修改如果任一项 *** 作失败了你都可以取消这个事务处理这些修改就不存在了如果这个事务处理过程完成了我们可以通过允许这个修改来确认这个 *** 作

lishixinzhi/Article/program/MySQL/201311/29301

当多个用户访问同一份数据时，一个用户在更改数据的过程中，可能有其他用户同时发起更改请求，为保证数据库记录的更新从一个一致性状态变为另外一个一致性状态，使用事务处理是非常必要的，事务具有以下四个特性：

MySQL 提供了多种事务型存储引擎，如 InnoDB 和 BDB 等，而 MyISAM 不支持事务。为了支持事务，InnoDB 存储引擎引入了与事务处理相关的 REDO 日志和 UNDO 日志，同时事务依赖于 MySQL 提供的锁机制

事务执行时需要将执行的事务日志写入日志文件，对应的文件为 REDO 日志。当每条 SQL 进行数据更新 *** 作时，首先将 REDO 日志写进日志缓冲区。当客户端执行 COMMIT 命令提交时，日志缓冲区的内容将被刷新到磁盘，日志缓冲区的刷新方式或者时间间隔可以通过参数 innodb_flush_log_at_trx_commit 控制

REDO 日志对应磁盘上的 ib_logifleN 文件，该文件默认为 5MB，建议设置为 512MB，以便容纳较大的事务。MySQL 崩溃恢复时会重新执行 REDO 日志的记录，恢复最新数据，保证已提交事务的持久性

与 REDO 日志相反，UNDO 日志主要用于事务异常时的数据回滚，具体内容就是记录数据被修改前的信息到 UNDO 缓冲区，然后在合适的时间将内容刷新到磁盘

假如由于系统错误或者 rollback *** 作而导致事务回滚，可以根据 undo 日志回滚到没修改前的状态，保证未提交事务的原子性

与 REDO 日志不同的是，磁盘上不存在单独的 UNDO 日志文件，所有的 UNDO 日志均存在表空间对应的 .ibd 数据文件中，即使 MySQL 服务启动了独立表空间

在 MySQL 中，可以使用 BEGIN 开始事务，使用 COMMIT 结束事务，中间可以使用 ROLLBACK 回滚事务。MySQL 通过 SET AUTOCOMMIT、START TRANSACTION、COMMIT 和 ROLLBACK 等语句支持本地事务

MySQL 定义了四种隔离级别，指定事务中哪些数据改变其他事务可见、哪些数据该表其他事务不可见。低级别的隔离级别可以支持更高的并发处理，同时占用的系统资源更少

InnoDB 系统级事务隔离级别可以使用以下语句设置：

查看系统级事务隔离级别：

InnoDB 会话级事务隔离级别可以使用以下语句设置：

查看会话级事务隔离级别：

在该隔离级别，所有事务都可以看到其他未提交事务的执行结果。读取未提交的数据称为脏读（Dirty Read），即是：首先开启 A 和 B 两个事务，在 B 事务更新但未提交之前，A 事务读取到了更新后的数据，但由于 B 事务回滚，导致 A 事务出现了脏读现象

所有事务只能看见已经提交事务所做的改变，此级别可以解决脏读，但也会导致不可重复读（Nonrepeatable Read）：首先开启 A 和 B 两个事务，A事务读取了 B 事务的数据，在 B 事务更新并提交后，A 事务又读取到了更新后的数据，此时就出现了同一 A 事务中的查询出现了不同的查询结果

MySQL 默认的事务隔离级别，能确保同一事务的多个实例在并发读取数据时看到同样的数据行，理论上会导致一个问题，幻读（Phontom Read）。例如，第一个事务对一个表中的数据做了修改，这种修改会涉及表中的全部数据行，同时第二个事务也修改这个表中的数据，这次的修改是向表中插入一行新数据，此时就会发生 *** 作第一个事务的用户发现表中还有没有修改的数据行

InnoDB 通过多版本并发控制机制（MVCC）解决了该问题：InnoDB 通过为每个数据行增加两个隐含值的方式来实现，这两个隐含值记录了行的创建时间、过期时间以及每一行存储时间发生时的系统版本号，每个查询根据事务的版本号来查询结果

通过强制事务排序，使其不可能相互冲突，从而解决幻读问题。简而言之，就是在每个读的数据行上加上共享锁实现，这个级别会导致大量的超时现象和锁竞争，一般不推荐使用

为了解决数据库并发控制问题，如走到同一时刻客户端对同一张表做更新或者查询 *** 作，需要对并发 *** 作进行控制，因此产生了锁

共享锁的粒度是行或者元组（多个行），一个事务获取了共享锁以后，可以对锁定范围内的数据执行读 *** 作

排他锁的粒度与共享锁相同，一个事务获取排他锁以后，可以对锁定范围内的数据执行写 *** 作

有两个事务 A 和 B，如果事务 A 获取了一个元组的共享锁，事务 B 还可以立即获取这个元组的共享锁，但不能获取这个元组的排他锁，必须等到事务 A 释放共享锁之后。如果事务 A 获取了一个元组的排他锁，事务 B 不能立即获取这个元组的共享锁，也不能立即获取这个元组的排他锁，必须等到 A 释放排他锁之后

意向锁是一种表锁，锁定的粒度是整张表，分为意向共享锁和意向排他锁。意向共享锁表示一个事务有意对数据上共享锁或者排他锁。有意表示事务想执行 *** 作但还没真正执行

锁的粒度主要分为表锁和行锁

表锁的开销最小，同时允许的并发量也是最小。MyISAM 存储引擎使用该锁机制。当要写入数据时，整个表记录被锁，此时其他读/写动作一律等待。一些特定的动作，如 ALTER TABLE 执行时使用的也是表锁

行锁可以支持最大的并发，InnoDB 存储引擎使用该锁机制。如果要支持并发读/写，建议采用 InnoDB 存储引擎

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7494851.html

MySQL数据库存储引擎详解

发表评论

评论列表（0条）