mysql新增字段语句_随笔

1. GCS行格式

需要在innodb中实现类似oracle的快速加字段功能，仅仅基于原来的行格式是不行的，必须对其进行扩展。为了保证原MySQL和innodb的兼容性，不改变原存储格式的行为，在线加字段功能是通过新增一种innodb行格式GCS（Game Cloud Storage）来实现，从而避免对其他格式造成影响。

虽然说是新增格式，但该格式与原默认的compact是基本一样的，只是新增了关键的Field Count（字段数）控制信息。

下面先回顾下compact行格式

Record Extra Bytes：是固定的5字节，表示记录的额外信息。

Nullable Bitmap：记录可空位图，使用1个bit来表示一个可空字段是否为NULL。

non-NULL Variable-Length Array：非空变长字段数组，表示非空变长字段（如varchar、varbinary）在该行的长度。

关于Compact格式的详细介绍可以参考文章。

compact格式有很重要的两个特点：

●字段的定义顺序与存储顺序基本一致（主键除外）

●字段为NULL不占存储空间，只需通过Nullable Bitmap记录。

基于以上特点，实现快速加字段功能GCS格式只需在记录头添加Field Count（字段数），来表示当前记录的字段数，占用1~2字节（若大于127，则使用2字节）

那么，解析GCS记录的关键逻辑就变为：

假设某GCS记录的Field count记录为x，表字段数为y，那么x <= y总是成立的。对于GCS格式，字段的解析变为：

●如果x == y或非GCS格式，按原来compact方式解析

●如果x <y，那么记录必定是在Alter Table加字段前就生成，那么最后y-x个字段必为NULL或默认值。

●如果该字段是允许为NULL，则为NULL。

●如果该字段不允许为NULL，则为默认值。

这样就可以将新增的字段解析出来。

另外，GCS格式在TMySQL中会替代compact作为innodb的默认行格式。

数据表中添加一个字段的SQL语句写法为：

1、alter table 表名 ADD 字段类型 NOT NULL Default 0

2、ALTER TABLE employee ADD spbh varchar(20) NOT NULL Default 0

3、在表employee 中加入 spbh 类型是varchar大小20 不为空默认值是0

扩展资料：

其他常用sql语句：

1、修改数据表中某项字段属性，为其添加备注。

语句格式：comment on column 库名.表名.字段名 is '输入的备注'

示例：我要在ers_data库中 test表 document_type字段添加备注，则sql语句为：

comment on column ers_data.test.document_type is '文件类型'

2、删除数据表中的某字段。

语句格式：alter table 表名 drop (字段)

传统情况

我们先回顾一下，在没有 "立刻加列" 功能时，加列 *** 作是怎么完成的。我们也借此来熟悉一下本期的图例：

当进行加列 *** 作时，所有的数据行都必须要增加一段数据（图中的列 4 数据）

如上一期图解所讲，当改变数据行的长度，就需要重建表空间（图中灰蓝的部分为发生变更的部分）

数据字典中的列定义也会被更新

以上 *** 作的问题在于每次加列 *** 作都需要重建表空间，这就需要大量 IO以及大量的时间

立刻加列

"立刻加列" 的过程如下图：

请点击输入图片描述

"立刻加列" 时，只会变更数据字典中的内容，包括：

在列定义中增加新列的定义

增加新列的默认值

"立刻加列" 后，当要读取表中的数据时：

由于 "立刻加列" 没有变更行数据，读取的行数据只有 3 列

MySQL 会将新增的第 4 列的默认值，追加到读取的数据后

以上过程描述了如何读取在 "立刻加列" 之前写入的数据，其实质是：在读取数据的过程中，"伪造" 了一个新列出来

那么如何读取在 "立刻加列" 之后写入的数据呢 ? 过程如下图：

当读取行 4 时：

请点击输入图片描述

通过判断数据行的头信息中的instant 标志位，可以知道该行的格式是 "新格式"：该行头信息后有一个新字段 "列数"

通过读取数据行的 "列数" 字段，可以知道该行数据中多少列有 "真实" 的数据，从而按列数读取数据

通过上图可以看到：读取在"立刻加列" 前/后写入的数据是不同的流程

通过以上的讨论，我们可以总结 "立刻加列" 之所以高效的原因是：

在执行 "立刻加列" 时，不变更数据行的结构

读取 "旧" 数据时，"伪造" 新增的列，使结果正确

写入 "新" 数据时，使用了新的数据格式（增加了instant标志位和 "列数" 字段)，以区分新旧数据

读取 "新" 数据时，可以如实读取数据

那么我们是否能一直 "伪造" 下去 ? "伪造" 何时会被拆穿 ?

考虑以下场景：

用 "立刻加列" 增加列 A

写入数据行 1

用 "立刻加列" 增加列 B

写入数据行 2

删除列 B

我们推测一下 "删除列 B" 的最小代价：需要修改数据行中的instant标志位或 "列数" 字段，这至少会影响到 "立刻加列" 之后写入的数据行，成本类似于重建数据

从以上推测可知：当出现与 "立刻加列" *** 作不兼容的 DDL *** 作时，数据表需要进行重建，如下图所示：

请点击输入图片描述

扩展思考题：是否能设计其他的数据格式，取代instant标志位和 "列数" 字段，使得加列/删列 *** 作都能 "立刻完成" ?（提示：考虑加列 - 删列 - 再加列的情况）

使用限制

在了解原理之后，我们来看看 "立刻加列" 的使用限制，就很容易能理解其中的前两项：

"立刻加列" 的加列位置只能在表的最后，而不能加在其他列之间

在元数据中，只记录了数据行应有多少列，而没有记录这些列应出现的位置。所以无法实现指定列的位置

"立刻加列" 不能添加主键列

加列不能涉及聚簇索引的变更，否则就变成了 "重建" *** 作，不是 "立刻" 完成了

"立刻加列"不支持压缩的表格式

按照 WL 的说法："COMPRESSED is no need to supported"（没必要支持不怎么用的格式）

总结回顾

我们总结一下上面的讨论：

"立刻加列" 之所以高效的原因是：

在执行 "立刻加列" 时，不变更数据行的结构

读取 "旧" 数据时，"伪造" 新增的列，使结果正确

写入 "新" 数据时，使用了新的数据格式 (增加了 instant 标志位和 "列数" 字段)，以区分新旧数据

读取 "新" 数据时，可以如实读取数据

"立刻加列" 的 "伪造" 手法，不能一直维持下去。当发生与 "立刻加列" *** 作不兼容的 DDL 时，表数据就会发生重建

回到之前遗留的两个问题：

"立刻加列" 是如何工作的 ?

我们已经解答了这个问题

所谓 "立刻加列" 是否完全不影响业务，是否是真正的 "立刻" 完成 ?

可以看到：就算是 "立刻加列"，也需要变更数据字典，那么该上的锁还是逃不掉的。也就是说这里的 "立刻" 指的是 "不变更数据行的结构"，而并非指 "零成本地完成任务"

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/6172180.html

mysql新增字段语句

发表评论

评论列表（0条）