MySQL 可以很好的支持大数据量的存取,但是一般说来,数据库中的表越小,在它上面执行的查询也就会越快。因此,在创建表的时候,为了获得更好的性能,我们可以将表中字段的宽度设得尽可能小。例如,在定义邮政编码这个字段时,如果将其设置为CHAR(255),显然给数据库增加了不必要的空间,甚至使用VARCHAR这种类型也是多余的,因为CHAR(6)就可以很好的完成任务了。同样的,如果可以的话,我们应该使用MEDIUMINT而不是BIGIN来定义整型字段。
另外一个提高效率的方法是在可能的情况下,应该尽量把字段设置为NOT NULL,这样在将来执行查询的时候,数据库不用去比较NULL值。
对于某些文本字段,例如“省份”或者“性别”,我们可以将它们定义为ENUM类型。因为在MySQL中,ENUM类型被当作数值型数据来处理,而数值型数据被处理起来的速度要比文本类型快得多。这样,我们又可以提高数据库的性能。
2、使用连接(JOIN)来代替子查询(Sub-Queries)
MySQL 从4.1开始支持SQL的子查询。这个技术可以使用SELECT语句来创建一个单列的查询结果,然后把这个结果作为过滤条件用在另一个查询中。例如,我们要将客户基本信息表中没有任何订单的客户删除掉,就可以利用子查询先从销售信息表中将所有发出订单的客户ID取出来,然后将结果传递给主查询,如下所示:
DELETE FROM customerinfo
WHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )
使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的SQL *** 作,同时也可以避免事务或者表锁死,并且写起来也很容易。但是,有些情况下,子查询可以被更有效率的连接(JOIN).. 替代。例如,假设我们要将所有没有订单记录的用户取出来,可以用下面这个查询完成:
SELECT * FROM customerinfo
WHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )
如果使用连接(JOIN).. 来完成这个查询工作,速度将会快很多。尤其是当salesinfo表中对CustomerID建有索引的话,性能将会更好,查询如下:
SELECT * FROM customerinfo
LEFT JOIN salesinfoON customerinfo.CustomerID=salesinfo.
CustomerID
WHERE salesinfo.CustomerID IS NULL
连接(JOIN).. 之所以更有效率一些,是因为 MySQL不需要在内存中创建临时表来完成这个逻辑上的需要两个步骤的查询工作。
3、使用联合(UNION)来代替手动创建的临时表
MySQL 从 4.0 的版本开始支持 UNION 查询,它可以把需要使用临时表的两条或更多的 SELECT 查询合并的一个查询中。在客户端的查询会话结束的时候,临时表会被自动删除,从而保证数据库整齐、高效。使用 UNION 来创建查询的时候,我们只需要用 UNION作为关键字把多个 SELECT 语句连接起来就可以了,要注意的是所有 SELECT 语句中的字段数目要想同。下面的例子就演示了一个使用 UNION的查询。
SELECT Name, Phone FROM client
UNION
SELECT Name, BirthDate FROM author
UNION
SELECT Name, Supplier FROM product
4、事务
尽管我们可以使用子查询(Sub-Queries)、连接(JOIN)和联合(UNION)来创建各种各样的查询,但不是所有的数据库 *** 作都可以只用一条或少数几条SQL语句就可以完成的。更多的时候是需要用到一系列的语句来完成某种工作。但是在这种情况下,当这个语句块中的某一条语句运行出错的时候,整个语句块的 *** 作就会变得不确定起来。设想一下,要把某个数据同时插入两个相关联的表中,可能会出现这样的情况:第一个表中成功更新后,数据库突然出现意外状况,造成第二个表中的 *** 作没有完成,这样,就会造成数据的不完整,甚至会破坏数据库中的数据。要避免这种情况,就应该使用事务,它的作用是:要么语句块中每条语句都 *** 作成功,要么都失败。换句话说,就是可以保持数据库中数据的一致性和完整性。事物以BEGIN 关键字开始,COMMIT关键字结束。在这之间的一条SQL *** 作失败,那么,ROLLBACK命令就可以把数据库恢复到BEGIN开始之前的状态。
BEGIN
INSERT INTO salesinfo SET CustomerID=14
UPDATE inventory SET Quantity=11
WHERE item='book'
COMMIT
事务的另一个重要作用是当多个用户同时使用相同的数据源时,它可以利用锁定数据库的方法来为用户提供一种安全的访问方式,这样可以保证用户的 *** 作不被其它的用户所干扰。
5、锁定表
尽管事务是维护数据库完整性的一个非常好的方法,但却因为它的独占性,有时会影响数据库的性能,尤其是在很大的应用系统中。由于在事务执行的过程中,数据库将会被锁定,因此其它的用户请求只能暂时等待直到该事务结束。如果一个数据库系统只有少数几个用户
来使用,事务造成的影响不会成为一个太大的问题;但假设有成千上万的用户同时访问一个数据库系统,例如访问一个电子商务网站,就会产生比较严重的响应延迟。
其实,有些情况下我们可以通过锁定表的方法来获得更好的性能。下面的例子就用锁定表的方法来完成前面一个例子中事务的功能。
LOCK TABLE inventory WRITE
SELECT Quantity FROM inventory
WHEREItem='book'
...
UPDATE inventory SET Quantity=11
WHEREItem='book'
UNLOCK TABLES
这里,我们用一个 SELECT 语句取出初始数据,通过一些计算,用 UPDATE 语句将新值更新到表中。包含有 WRITE 关键字的 LOCK TABLE 语句可以保证在 UNLOCK TABLES 命令被执行之前,不会有其它的访问来对 inventory 进行插入、更新或者删除的 *** 作。
6、使用外键
锁定表的方法可以维护数据的完整性,但是它却不能保证数据的关联性。这个时候我们就可以使用外键。例如,外键可以保证每一条销售记录都指向某一个存在的客户。在这里,外键可以把customerinfo 表中的CustomerID映射到salesinfo表中CustomerID,任何一条没有合法CustomerID的记录都不会被更新或插入到 salesinfo中。
CREATE TABLE customerinfo
(
CustomerID INT NOT NULL ,
PRIMARY KEY ( CustomerID )
) TYPE = INNODB
CREATE TABLE salesinfo
(
SalesID INT NOT NULL,
CustomerID INT NOT NULL,
PRIMARY KEY(CustomerID, SalesID),
FOREIGN KEY (CustomerID) REFERENCES customerinfo
(CustomerID) ON DELETECASCADE
) TYPE = INNODB
注意例子中的参数“ON DELETE CASCADE”。该参数保证当 customerinfo 表中的一条客户记录被删除的时候,salesinfo 表中所有与该客户相关的记录也会被自动删除。如果要在 MySQL 中使用外键,一定要记住在创建表的时候将表的类型定义为事务安全表 InnoDB类型。该类型不是 MySQL 表的默认类型。定义的方法是在 CREATE TABLE 语句中加上 TYPE=INNODB。如例中所示。
7、使用索引
索引是提高数据库性能的常用方法,它可以令数据库服务器以比没有索引快得多的速度检索特定的行,尤其是在查询语句当中包含有MAX(), MIN()和ORDERBY这些命令的时候,性能提高更为明显。那该对哪些字段建立索引呢?一般说来,索引应建立在那些将用于JOIN, WHERE判断和ORDER BY排序的字段上。尽量不要对数据库中某个含有大量重复的值的字段建立索引。对于一个ENUM类型的字段来说,出现大量重复值是很有可能的情况,例如 customerinfo中的“province”.. 字段,在这样的字段上建立索引将不会有什么帮助;相反,还有可能降低数据库的性能。我们在创建表的时候可以同时创建合适的索引,也可以使用ALTER TABLE或CREATE INDEX在以后创建索引。此外,MySQL
从版本3.23.23开始支持全文索引和搜索。全文索引在 MySQL 中是一个FULLTEXT类型索引,但仅能用于MyISAM 类型的表。对于一个大的数据库,将数据装载到一个没有FULLTEXT索引的表中,然后再使用ALTER TABLE或CREATE INDEX创建索引,将是非常快的。但如果将数据装载到一个已经有FULLTEXT索引的表中,执行过程将会非常慢。
8、优化的查询语句
绝大多数情况下,使用索引可以提高查询的速度,但如果SQL语句使用不恰当的话,索引将无法发挥它应有的作用。下面是应该注意的几个方面。首先,最好是在相同类型的字段间进行比较的 *** 作。在MySQL 3.23版之前,这甚至是一个必须的条件。例如不能将一个建有索引的INT字段和BIGINT字段进行比较;但是作为特殊的情况,在CHAR类型的字段和 VARCHAR类型字段的字段大小相同的时候,可以将它们进行比较。其次,在建有索引的字段上尽量不要使用函数进行 *** 作。
例如,在一个DATE类型的字段上使用YEAE()函数时,将会使索引不能发挥应有的作用。所以,下面的两个查询虽然返回的结果一样,但后者要比前者快得多。
SELECT * FROM order WHERE YEAR(OrderDate)<2001
SELECT * FROM order WHERE OrderDate<"2001-01-01"
同样的情形也会发生在对数值型字段进行计算的时候:
SELECT * FROM inventory WHERE Amount/7<24
SELECT * FROM inventory WHERE Amount<24*7
上面的两个查询也是返回相同的结果,但后面的查询将比前面的一个快很多。第三,在搜索字符型字段时,我们有时会使用 LIKE 关键字和通配符,这种做法虽然简单,但却也是以牺牲系统性能为代价的。例如下面的查询将会比较表中的每一条记录。
SELECT * FROM books
WHERE name like "MySQL%"
但是如果换用下面的查询,返回的结果一样,但速度就要快上很多:
SELECT * FROM books
WHERE name>="MySQL"and name<"MySQM"
最后,应该注意避免在查询中让MySQL进行自动类型转换,因为转换过程也会使索引变得不起作用。
有助于效率的类型选择
使你的数据尽可能小
最基本的优化之一是使你的数据(和索引)在磁盘上(并且在内存中)占据的空间尽可能小 这能给出巨大的改进 因为磁盘读入较快并且通常也用较少的主存储器 如果在更小的列上做索引 索引也占据较少的资源
你能用下面的技术使表的性能更好并且使存储空间最小
·尽可能地使用最有效(最小)的类型 MySQL有很多节省磁盘空间和内存的专业化类型
·如果可能使表更小 使用较小的整数类型 例如 MEDIUMINT经常比INT好一些
·如果可能 声明列为NOT NULL 它使任何事情更快而且你为每列节省一位 注意如果在你的应用程序中你确实需要NULL 你应该毫无疑问使用它 只是避免缺省地在所有列上有它
使用定长列 不使用可变长列
这条准则对被经常修改 从而容易产生碎片的表来说特别重要 例如 应该选择 CHAR 列而不选择 VARCHAR 列 所要权衡的是使用定长列时 表所占用的空间更多 但如果能够承担这种空间的耗费 使用定长行将比使用可变长的行处理快得多
将列定义为 NOT NULL
这样处理更快 所需空间更少 而且有时还能简化查询 因为不需要检查是否存在特例 NULL
考虑使用 ENUM 列
如果有一个只含有限数目的特定值的列 那么应该考虑将其转换为 ENUM 列 ENUM 列的值可以更快地处理 因为它们在内部是以数值表示的
有关BLOB和TEXT类型
使用BLOB和TEXT类型的优点
用 BLOB 存储应用程序中包装或未包装的数据 有可能使原来需要几个检索 *** 作才能完成的数据检索得以在单个检索 *** 作中完成 而且还对存储标准表结构不易表示的数据或随时间变化的数据有帮助
使用BLOB和TEXT类型的可能弊端
另一方面 BLOB 值也有自己的固有问题 特别是在进行大量的 DELETE 或 UPDATE *** 作时更是如此 删除 BLOB 会在表中留下一个大空白 在以后将需用一个记录或可能是不同大小的多个记录来填充
除非有必要 否则应避免检索较大的 BLOB 或 TEXT 值 例如 除非肯定WHERE 子句能够将结果恰好限制在所想要的行上 否则 SELECT * 查询不是一个好办法 这样做可能会将非常大的 BLOB 值无目的地从网络上拖过来 这是存储在另一列中的 BLOB 标识信息很有用的另一种情形 可以搜索该列以确定想要的行 然后从限定的行中检索 BLOB 值
必要的准则
对容易产生碎片的表使用 OPTIMIZE TABLE
大量进行修改的表 特别是那些含有可变长列的表 容易产生碎片 碎片不好 因为它在存储表的磁盘块中产生不使用的空间 随着时间的增长 必须读取更多的块才能取到有效的行 从而降低了性能 任意具有可变长行的表都存在这个问题 但这个问题对 BLOB 列更为突出 因为它们尺寸的变化非常大 经常使用 OPTIMIZE TABLE 有助于保持性能不下降
使用多列索引
多列索引列有时很有用 一种技术是根据其他列建立一个散列值 并将其存储在一个独立的列中 然后可通过搜索散列值找到行 这只对精确匹配的查询有效 (散列值对具有诸如 <或 >= 这样的 *** 作符的范围搜索没有用处) 在MySQL 版及以上版本中 散列值可利用 MD ( ) 函数产生 散列索引对 BLOB 列特别有用 有一事要注意 在 MySQL 以前的版本中 不能索引 BLOB 类型 甚至是在 或更新的版本中 利用散列值作为标识值来查找 BLOB 值也比搜索 BLOB 列本身更快
将 BLOB 值隔离在一个独立的表中
在某些情况下 将 BLOB 列从表中移出放入另一个副表可能具有一定的意义 条件是移出 BLOB 列后可将表转换为定长行格式 这样会减少主表中的碎片 而且能利用定长行的性能优势
使用ANALYSE过程检查表列
如果使用的是 MySQL 或更新的版本 应该执行 PROCEDURE ANALYSE( ) 查看它所提供的关于表中列的信息
ANALYSE([max elements [max memory]])
它检验来自你的查询的结果并返回结果的分析
max elements(缺省 )是 *** yse将注意的每列不同值的最大数量 这被ANALYSE用来检查最佳的列类型是否应该是ENUM类型
max memory(缺省 )是在 *** yse尝试寻找所有不同值的时候应该分配给每列的最大内存量
SELECT FROM WHERE PROCEDURE ANALYSE([max elements [max memory]])
例如
mysql>SELECT * FROM student PROCEDURE ANALYSE()
mysql>SELECT * FROM student PROCEDURE ANALYSE( )
相应输出中有一列是关于表中每列的最佳列类型的建议 第二个例子要求 PROCEDURE ANALYSE( ) 不要建议含有多于 个值或取多于 字节的 ENUM 类型(可根据需要更改这些值) 如果没有这样的限制 输出可能会很长ENUM 的定义也会很难阅读
lishixinzhi/Article/program/MySQL/201311/29636一、优化表的数据类型
select * from tablename procedure analyse(16.265)
上面输出一列信息,牟你数据表的字段提出优化建义,
二、通过拆分表提高数据访问效率
拆分一是指针对表进行拆分,如果是针对myisam类型的表进行处理的话,可以有两种拆分方法
1、是垂直拆分,把主要的与一些散放到一个表,然后把主要的和另外的列放在另一张表。
2、水平拆分方法,根据一列或多列的值把数据行放到两个独立的表中,水平拆分通常几种情况。
表很大,拆分后可降低查询时数据和索引的查询速度,同时也降低了索引的层数,提高查询的速度。
表中的数据本来就有独立性,表中分别记录各个地区的数据或不同时期的数据,特别是有些数据常用,厕国一些数据不常用的情况下,
需要把数据存放到多个不同的介质上。
三、逆规范化
四、使用中间表优化方法
对于数据库教程大的表源码天空
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)