MySQL 主从一直是面试常客,里面的知识点虽然基础,但是能回答全的同学不多。
比如楼哥之前面试小米,就被问到过主从复制的原理,以及主从延迟的解决方案,因为回答的非常不错,给面试官留下非常好的印象。你之前面试,有遇到过哪些 MySQL 主从的问题呢?
所谓 MySQL 主从,就是建立两个完全一样的数据库,一个是主库,一个是从库, 主库对外提供读写的 *** 作,从库对外提供读的 *** 作 ,下面是一主一从模式:
对于数据库单机部署,在 4 核 8G 的机器上运行 MySQL 5.7 时,大概可以支撑 500 的 TPS 和 10000 的 QPS, 当遇到一些活动时,查询流量骤然,就需要进行主从分离。
大部分系统的访问模型是读多写少,读写请求量的差距可能达到几个数量级,所以我们可以通过一主多从的方式, 主库只负责写入和部分核心逻辑的查询,多个从库只负责查询,提升查询性能,降低主库压力。
MySQL 主从还能做到服务高可用,当主库宕机时,从库可以切成主库,保证服务的高可用,然后主库也可以做数据的容灾备份。
整体场景总结如下:
MySQL 的主从复制是依赖于 binlog 的,也就是记录 MySQL 上的所有变化并以二进制形式保存在磁盘上二进制日志文件。
主从复制就是将 binlog 中的数据从主库传输到从库上,一般这个过程是异步的,即主库上的 *** 作不会等待 binlog 同步的完成。
详细流程如下:
当主库和从库数据同步时,突然中断怎么办?因为主库与从库之间维持了一个长链接,主库内部有一个线程,专门服务于从库的这个长链接的。
对于下面的情况,假如主库执行如下 SQL,其中 a 和 create_time 都是索引:
我们知道,数据选择了 a 索引和选择 create_time 索引,最后 limit 1 出来的数据一般是不一样的。
所以就会存在这种情况:在 binlog = statement 格式时,主库在执行这条 SQL 时,使用的是索引 a,而从库在执行这条 SQL 时,使用了索引 create_time,最后主从数据不一致了。
那么我们改如何解决呢?
可以把 binlog 格式修改为 row,row 格式的 binlog 日志记录的不是 SQL 原文,而是两个 event:Table_map 和 Delete_rows。
Table_map event 说明要 *** 作的表,Delete_rows event用于定义要删除的行为,记录删除的具体行数。 row 格式的 binlog 记录的就是要删除的主键 ID 信息,因此不会出现主从不一致的问题。
但是如果 SQL 删除 10 万行数据,使用 row 格式就会很占空间的,10 万条数据都在 binlog 里面,写 binlog 的时候也很耗 IO。但是 statement 格式的 binlog 可能会导致数据不一致。
设计 MySQL 的大叔想了一个折中的方案,mixed 格式的 binlog,其实就是 row 和 statement 格式混合使用, 当 MySQL 判断可能数据不一致时,就用 row 格式,否则使用就用 statement 格式。
有时候我们遇到从数据库中获取不到信息的诡异问题时,会纠结于代码中是否有一些逻辑会把之前写入的内容删除,但是你又会发现,过了一段时间再去查询时又可以读到数据了,这基本上就是主从延迟在作怪。
主从延迟,其实就是“从库回放” 完成的时间,与 “主库写 binlog” 完成时间的差值, 会导致从库查询的数据,和主库的不一致 。
谈到 MySQL 数据库主从同步延迟原理,得从 MySQL 的主从复制原理说起:
总结一下主从延迟的主要原因 :主从延迟主要是出现在 “relay log 回放” 这一步,当主库的 TPS 并发较高,产生的 DDL 数量超过从库一个 SQL 线程所能承受的范围,那么延时就产生了,当然还有就是可能与从库的大型 query 语句产生了锁等待。
我们一般会把从库落后的时间作为一个重点的数据库指标做监控和报警,正常的时间是在毫秒级别,一旦落后的时间达到了秒级别就需要告警了。
解决该问题的方法,除了缩短主从延迟的时间,还有一些其它的方法,基本原理都是尽量不查询从库。
具体解决方案如下:
在实际应用场景中,对于一些非常核心的场景,比如库存,支付订单等,需要直接查询从库,其它非核心场景,就不要去查主库了。
两台机器 A 和 B,A 为主库,负责读写,B 为从库,负责读数据。
如果 A 库发生故障,B 库成为主库负责读写,修复故障后,A 成为从库,主库 B 同步数据到从库 A。
一台主库多台从库,A 为主库,负责读写,B、C、D为从库,负责读数据。
如果 A 库发生故障,B 库成为主库负责读写,C、D负责读,修复故障后,A 也成为从库,主库 B 同步数据到从库 A。
where子句设置了搜索条件 它在insert update delete语句中的应用方法也与在select语句中的应用方法完全相同 搜索条件紧跟在关键词where的后面 如果用户要在语句中使用多个搜索条件 则可用and或or连接 搜索条件的基本语法是[not] expression parison_operator expression[not] expression [not] like match_string [not] expression is [not] null[not] expression [not] beeen expression and expression[not] column_name join_operator column_name[not] boolean_expression
and 用来联结两个条件 并在两个条件都是TRUE的时候返回结果 当在同一语句中使用多个逻辑运算符时 and运算符总是最优先 除非用户用括号改变了运算顺序
or 用来联结两个条件 当两个条件中有任一条件是TRUE的时候返回结果 当在同一语句中使用多个逻辑运算符时 运算符or通常在运算符and之后进行运算 当然用户可以使用括号改变运算的顺序
beeen 用来标识范围下限的关键词 and后面跟范围上限的值 范围where @val beeen x and y包含首尾值 如果beeen后面指定的第一个值大于第二个值 则该查询不返回任何行
column_name 在比较中使用的列名 在会产生歧义时 一定要指明列所在的表名
parison_operator 比较运算符 见下表
Word WRAP: break word bgColor=#f f f >以下是引用片段 符号 意义 = 等于 > 大于 < 小于 >= 大于等于 <= 小于等于 != 不等于 <> 不等于
在比较char varchar型 数据 时 <的意思是更接近字母表头部 >代表更接近字母表尾部 一般来说 小写字母大于大写字母 大写字母大于数字 但是这可能依赖于 服务器 上 *** 作系统 的比较顺序
在比较时 末尾的空格是被忽略的 例如 Dirk 等于 Dirk
在比较日期时 <表示早于 >表示晚于
在使用比较运算符比较character和datetime数据时 需用引号将所有数据引起来
expression 可能是列名 常数 函数或者是列名或常数的任意组合 以及以算术运算符或逐位运算符连接的函数 算术运算符如下表所示
以下是引用片段 符号 意义 + 加号 减号 * 乘号 / 除号
is null 在搜索一个NULL值时使用
like 关键词 对char varchar和datetime(不包括秒和毫秒)可以使用like 在 MySQL 中like也可以用在数字的表达式上
当用户在搜索datetime型 数据 时 最好是使用关键词like 因为完整的datetime记录包含各种各样的日期组件 例如用户在列arrival_time中加入一个值 : 而子句where arrival_time= : 却没有发现它 因为MySQL把录入的数据转换成了 Jan : AM 然而子句where arrival_time like % : % 就能找到它
boolean_expression 返回 true 或 false 值的表达式
match_string 由字符和通配符组成的串 用单引号或双引号引起来 是匹配模式 通配符如下表所示
Word WRAP: break word bgColor=#f f f >以下是引用片段 符号 意义 % 或多个字符的字符串 _ 任何一单个字符 not 否定任何逻辑表达式 或是关键词 如like null beeen等 group by和having子句在select语句中使用 可以将表划分成组并返回匹配having子句条件的组 语法 select语句开头 group by [all] aggregate_free_expression [ aggregate_free_expression]* [having search_conditions]
select语句结尾
group by 指定表将划分的组群 如果在select表项中包含集合函数 则为各组计算一个总计值 这些总计值的结果以新的列显示 而不是新的行 在having子句中用户可以引用这些新的总计列 在group by之前的select_list中可以使用avg count max min和sum等集合函数 表可以被任意列的组合分组
all 在结果中包含所有组群的Transact SQL扩展 这里的所有组群甚至包括那些被where子句所排除的组群 如果同时使用having子句 将对all的意义进行否定
aggregate_free_expression 不包含集合函数的表达式 Transact SQL扩展允许在用列名称分组的同时 用无集合函数的表达式分组
having 为group by子句设置条件 类似于where为select语句设置条件的方法 having的查找条件可以包括集合函数表达式 除此之外 它的查找条件与where查找条件相同
order by 按列排列结果 对select输出的列可以用列名 列别名或列位置来引用 例如 select id as myid name as myname from mytable group by id select id as myid name as myname from mytable group by myid select id as myid name as myname from mytable group by 这三句是完全等价的 当然 我们不赞成用第三种用法 这将给程序的可读性带来不好的影响 为了以降序排列 把DESC关键词加到order by子句中你要排序的列名前 缺省是升序 你也可以用ASC关键词明确指定
limit 子句 用来限制select语句返回的行数 limit取 个或 个数字参数 如果给定 个参数 第一个指定要返回的第一行的偏移量 第二个指定返回行的最大数目 初始行的偏移量是 (不是 ) 如果给定一个参数 它指出偏移量为 的返回行的最大数目 也就是说limit 和limit 完全等价
至于procedure关键词的含义 我也没搞得太清楚 好象是对存储过程的支持 而MySQL本身不支持存储过程 看来是为了将来扩充的需要而保留的吧
lishixinzhi/Article/program/MySQL/201311/29617
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)