导读 | 总结一下,MySQL 并行复制策略主要是有三种思想:按照库的级别粒度并行执行,用于决定分发策略的 hash 表里,key 就是数据库名。按照行级别,根据id、唯一索引、value、库名这些来计算hash值,做分组标示根据redo log 持久化原理,同一个commit组 或者 同时进入prepare或者commit表示可以同步执行。 |
导致备库延迟的原因主要有如下几种:
解决方案:
从MySQL5.6开始支持并行复制,这就解决了之前复制速度缓慢的问题。coordinator 就是原来的 sql_thread, 他负责读取中转日志和分发事务。真正更新日志的,变成了 worker 线程。work 线程的个数由参数 slave_parallel_workers 决定的。既然是并行就一定会有数据一致性的问题,两个不同的事务如果在不同的work中同时执行,顺序的影响也会造成结果不同。
所以在 coordinator 分发任务的时候,要满足以下这两个基本要求:
不能造成更新覆盖。这就要求更新同一行的两个事务,必须被分发到同一个 worker 中。
同一个事务不能被拆开,必须放到同一个 worker 中。
各个版本的多线程复制,都遵循了这两条基本原则。
官方 MySQL5.6 版本,支持了并行复制,只是支持的粒度是按库并行。用于决定分发策略的 hash 表里,key 就是数据库名,同一个数据库需要在同一个worker中串行执行,这就避免了事务之间相互影响的问题。
MariaDB 的并行复制策略利用redo log 组提交 (group commit) 优化的特性:能够在同一组里提交的事务,一定不会修改同一行。所以可以按照食物的 commit—_id来分组。
在实现上,MariaDB 是这么做的:
在一组里面一起提交的事务,有一个相同的 commit_id,下一组就是 commit_id+1;
commit_id 直接写到 binlog 里面;传到备库应用的时候,相同 commit_id 的事务分发到多个 worker 执行;
这一组全部执行完成后,coordinator 再去取下一批。
MySQL5.7中对 MariaDB 多策略进行了优化。因为同时处于 prepare 状态的事务,在备库执行时是可以并行的,此时的redolog已经经过了并行验证,所以从库也可以执行。具体步骤不做赘述,参考MariaDB策略。
在 2018 年 4 月份发布的 MySQL 5.7.22 版本里(最新5.7.37),MySQL 增加了一个新的并行复制策略,基于 WRITESET 的并行复制。相应地,新增了一个参数 binlog-transaction-dependency-tracking,用来控制是否启用这个新策略。这个参数的可选值有以下三种。
当然为了唯一标识,这个 hash 值是通过“库名 + 表名 + 索引名 + 值”计算出来的。如果一个表上除了有主键索引外,还有其他唯一索引,那么对于每个唯一索引,insert 语句对应的 writeset 就要多增加一个 hash 值。
总结一下,MySQL 并行复制策略主要是有三种思想:
按照库的级别粒度并行执行,用于决定分发策略的 hash 表里,key 就是数据库名。
按照行级别,根据id、唯一索引、value、库名这些来计算hash值,做分组标示
根据redo log 持久化原理,同一个commit组 或者 同时进入prepare或者commit表示可以同步执行。
原文来自:
本文地址://lrxjmw.cn/mysql-copy-slowly.html编辑:王婷,审核员:逄增宝
Linux大全:
Linux系统大全: