在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
简介 MySQL通过复制(Replication)实现存储系统的高可用。目前,MySQL支持的复制方式有:
本文主要讨论MySQL半同步复制。 半同步复制的基本流程 MySQL半同步复制的实现是建立在MySQL异步复制的基础上的。MySQL支持两种略有不同的半同步复制:AFTER_SYNC和AFTER_COMMIT(受rpl_semi_sync_master_wait_wait_point控制)。 开启半同步复制时,Master在返回之前会等待Slave的响应或超时。当Slave超时时,半同步复制退化成异步复制。这也是MySQL半同步复制存在的一个问题。本文不讨论Salve超时的情形(不讨论异步复制)。 半同步复制AFTER_SYNC模式的基本流程 AFTER_SYNC模式是MySQL 5.7才支持的半同步复制方式,也是MySQL5.7默认的半同步复制方式:
半同步复制AFTER_COMMIT模式的基本流程 MySQL 5.5和5.6的半同步复制只支持AFTER_COMMIT:
AFTER_SYNC和AFTER_COMMIT两种方式的小结 AFTER_SYNC: 日志复制到Slave之后,Master再commit。 AFTER_COMMIT:Master commit之后再将日志复制到Slave。 AFTER_SYNC模式下的异常情况分析 异常情况1:master宕机后,主备切换。 master执行事务T,在将事务T的binlog刷到硬盘之前,master发生宕机。slave升级为master。master重启后,crash recovery会对事务T进行回滚。主备数据一致。 master执行事务T,在将事务T的binlog刷到硬盘之后,收到slave的ACK之前,master发生宕机(存在pendinglog)。slave升级为master。 2.1 slave还没有收到事务T的binlog,master重启后,crash recovery会直接提交pendinglog。主备数据不一致。 2.2 slave已经收到事务T的binlog。主备数据一致。 异常情况2:master宕机后,不切换主机。只需考虑异常情况1中的2.1。 master重启后,直接提交pendinglog,此时,主备数据不一致: slave连接上master,通过异步复制的方式获得事务T的binlog。主备数据一致。 从上面异常情况的简单分析我们得知,半同步复制需要处理master宕机后重启存在pendinglog(slave没有应答的binlog)的特殊情况。 针对master宕机后,不进行主备切换的情形: 在crash recovery之后,master等到slave的连接和复制,直到至少有一个slave复制了所有已提交的事务的binlog。(SHOW MASTER STATUS on master and SELECT master_pos_wait() on slave)。 针对master宕机后,进行主备切换的情形: 旧master重启后,在crash recovery时,对pendinglog进行回滚。(人工截断master的binlog未复制的部分?) 思考 为什么master重启之后,crash recovery的过程中,是直接commit pendinglog,而不是重试请求slave的应答呢? MySQL的异步复制和半同步复制都是由slave触发的,slave主动去连接master同步binlog。 没有发生主备切换,机器重启后无法知道哪台机器是slave。 总结 MySQL半同步复制存在以下问题:
正因为MySQL在主备数据一致性存在着这些问题,影响了互联网业务7*24的高可用服务,因此各大公司纷纷祭出自己的“补丁”:腾讯的TDSQL、微信的PhxSQL、阿里的AliSQL、网易的InnoSQL。 MySQL官方已经在MySQL5.7推出新的复制模式——MySQL Group Replication。 参考文献 MySQL High Availability Solutions |
请发表评论