下载APP



44丨答疑文章（三）：说一说这些好问题

林晓斌 2019-2-22

讲述：王庆友

时长00:16:20大小15,343.936M



这是我们专栏的最后一篇答疑文章，今天我们来说说一些好问题。

在我看来，能够帮我们扩展一个逻辑的边界的问题，就是好问题。因为通过解决这样的问题，能够加深我们对这个逻辑的理解，或者帮我们关联到另外一个知识点，进而可以帮助我们建立起自己的知识网络。

在工作中会问好问题，是一个很重要的能力。

经过这段时间的学习，从评论区的问题我可以感觉出来，紧跟课程学习的同学，对SQL语句执行性能的感觉越来越好了，提出的问题也越来越细致和精准了。

接下来，我们就一起看看同学们在评论区提到的这些好问题。在和你一起分析这些问题的时候，我会指出它们具体是在哪篇文章出现的。同时，在回答这些问题的过程中，我会假设你已经掌握了这篇文章涉及的知识。当然，如果你印象模糊了，也可以跳回文章再复习一次。

join的写法

在第35篇文章《join语句怎么优化？》中，我在介绍join执行顺序的时候，用的都是straight_join。@郭健同学在文后提出了两个问题：

如果用left join的话，左边的表一定是驱动表吗？
如果两个表的join包含多个条件的等值匹配，是都要写到on里面呢，还是只把一个条件写到on里面，其他条件写到where部分？

为了同时回答这两个问题，我来构造两个表a和b：

create table a(f1 int, f2 int, index(f1))engine=innodb;
create table b(f1 int, f2 int)engine=innodb;
insert into a values(1,1),(2,2),(3,3),(4,4),(5,5),(6,6);
insert into b values(3,3),(4,4),(5,5),(6,6),(7,7),(8,8);

表a和b都有两个字段f1和f2，不同的是表a的字段f1上有索引。然后，我往两个表中都插入了6条记录，其中在表a和b中同时存在的数据有4行。

@郭健同学提到的第二个问题，其实就是下面这两种写法的区别：

select * from a left join b on(a.f1=b.f1) and (a.f2=b.f2); /*Q1*/
select * from a left join b on(a.f1=b.f1) where (a.f2=b.f2);/*Q2*/

我把这两条语句分别记为Q1和Q2。

首先，需要说明的是，这两个left join语句的语义逻辑并不相同。我们先来看一下它们的执行结果。

图1 两个join的查询结果

可以看到：

语句Q1返回的数据集是6行，表a中即使没有满足匹配条件的记录，查询结果中也会返回一行，并将表b的各个字段值填成NULL。
语句Q2返回的是4行。从逻辑上可以这么理解，最后的两行，由于表b中没有匹配的字段，结果集里面b.f2的值是空，不满足where 部分的条件判断，因此不能作为结果集的一部分。

接下来，我们看看实际执行这两条语句时，MySQL是怎么做的。

我们先一起看看语句Q1的explain结果：

图2 Q1的explain结果

可以看到，这个结果符合我们的预期：

驱动表是表a，被驱动表是表b；
由于表b的f1字段上没有索引，所以使用的是Block Nested Loop Join（简称BNL）算法。

看到BNL算法，你就应该知道这条语句的执行流程其实是这样的：

把表a的内容读入join_buffer 中。因为是select * ，所以字段f1和f2都被放入join_buffer了。
顺序扫描表b，对于每一行数据，判断join条件（也就是(a.f1=b.f1) and (a.f1=1)）是否满足，满足条件的记录, 作为结果集的一行返回。如果语句中有where子句，需要先判断where部分满足条件后，再返回。
表b扫描完成后，对于没有被匹配的表a的行（在这个例子中就是(1,1)、(2,2)这两行），把剩余字段补上NULL，再放入结果集中。

对应的流程图如下：

图3 left join -BNL算法

可以看到，这条语句确实是以表a为驱动表，而且从执行效果看，也和使用straight_join是一样的。

你可能会想，语句Q2的查询结果里面少了最后两行数据，是不是就是把上面流程中的步骤3去掉呢？我们还是先看一下语句Q2的expain结果吧。

图4 Q2的explain结果

这里先和你说一句题外话，专栏马上就结束了，我也和你一起根据explain结果“脑补”了很多次一条语句的执行流程了，所以我希望你已经具备了这个能力。今天，我们再一起分析一次SQL语句的explain结果。

可以看到，这条语句是以表b为驱动表的。而如果一条join语句的Extra字段什么都没写的话，就表示使用的是Index Nested-Loop Join（简称NLJ）算法。

因此，语句Q2的执行流程是这样的：顺序扫描表b，每一行用b.f1到表a中去查，匹配到记录后判断a.f2=b.f2是否满足，满足条件的话就作为结果集的一部分返回。

那么，为什么语句Q1和Q2这两个查询的执行流程会差距这么大呢？其实，这是因为优化器基于Q2这个查询的语义做了优化。

为了理解这个问题，我需要再和你交代一个背景知识点：在MySQL里，NULL跟任何值执行等值判断和不等值判断的结果，都是NULL。这里包括， select NULL = NULL 的结果，也是返回NULL。

因此，语句Q2里面where a.f2=b.f2就表示，查询结果里面不会包含b.f2是NULL的行，这样这个left join的语义就是“找到这两个表里面，f1、f2对应相同的行。对于表a中存在，而表b中匹配不到的行，就放弃”。

这样，这条语句虽然用的是left join，但是语义跟join是一致的。

因此，优化器就把这条语句的left join改写成了join，然后因为表a的f1上有索引，就把表b作为驱动表，这样就可以用上NLJ 算法。在执行explain之后，你再执行show warnings，就能看到这个改写的结果，如图5所示。

图5 Q2的改写结果

这个例子说明，即使我们在SQL语句中写成left join，执行过程还是有可能不是从左到右连接的。也就是说，使用left join时，左边的表不一定是驱动表。

这样看来，如果需要left join的语义，就不能把被驱动表的字段放在where条件里面做等值判断或不等值判断，必须都写在on里面。那如果是join语句呢？

这时候，我们再看看这两条语句：

select * from a join b on(a.f1=b.f1) and (a.f2=b.f2); /*Q3*/
select * from a join b on(a.f1=b.f1) where (a.f2=b.f2);/*Q4*/

我们再使用一次看explain 和 show warnings的方法，看看优化器是怎么做的。

图6 join语句改写

可以看到，这两条语句都被改写成：

select * from a join b where (a.f1=b.f1) and (a.f2=b.f2);

执行计划自然也是一模一样的。

也就是说，在这种情况下，join将判断条件是否全部放在on部分就没有区别了。

Simple Nested Loop Join 的性能问题

我们知道，join语句使用不同的算法，对语句的性能影响会很大。在第34篇文章《到底可不可以使用join？》的评论区中，@书策稠浊和 @朝夕心两位同学提了一个很不错的问题。

我们在文中说到，虽然BNL算法和Simple Nested Loop Join 算法都是要判断M*N次（M和N分别是join的两个表的行数），但是Simple Nested Loop Join 算法的每轮判断都要走全表扫描，因此性能上BNL算法执行起来会快很多。

为了便于说明，我还是先为你简单描述一下这两个算法。

BNL算法的执行逻辑是：

首先，将驱动表的数据全部读入内存join_buffer中，这里join_buffer是无序数组；
然后，顺序遍历被驱动表的所有行，每一行数据都跟join_buffer中的数据进行匹配，匹配成功则作为结果集的一部分返回。

Simple Nested Loop Join算法的执行逻辑是：顺序取出驱动表中的每一行数据，到被驱动表去做全表扫描匹配，匹配成功则作为结果集的一部分返回。

这两位同学的疑问是，Simple Nested Loop Join算法，其实也是把数据读到内存里，然后按照匹配条件进行判断，为什么性能差距会这么大呢？

解释这个问题，需要用到MySQL中索引结构和Buffer Pool的相关知识点：

在对被驱动表做全表扫描的时候，如果数据没有在Buffer Pool中，就需要等待这部分数据从磁盘读入；
从磁盘读入数据到内存中，会影响正常业务的Buffer Pool命中率，而且这个算法天然会对被驱动表的数据做多次访问，更容易将这些数据页放到Buffer Pool的头部（请参考第35篇文章中的相关内容)；
即使被驱动表数据都在内存中，每次查找“下一个记录的操作”，都是类似指针操作。而join_buffer中是数组，遍历的成本更低。

所以说，BNL算法的性能会更好。

distinct 和 group by的性能

在第37篇文章《什么时候会使用内部临时表？》中，@老杨同志提了一个好问题：如果只需要去重，不需要执行聚合函数，distinct 和group by哪种效率高一些呢？

我来展开一下他的问题：如果表t的字段a上没有索引，那么下面这两条语句：

select a from t group by a order by null;
select distinct a from t;

的性能是不是相同的?

首先需要说明的是，这种group by的写法，并不是SQL标准的写法。标准的group by语句，是需要在select部分加一个聚合函数，比如：

select a,count(*) from t group by a order by null;

这条语句的逻辑是：按照字段a分组，计算每组的a出现的次数。在这个结果里，由于做的是聚合计算，相同的a只出现一次。

备注：这里你可以顺便复习一下第37篇文章中关于group by的相关内容。

没有了count(*)以后，也就是不再需要执行“计算总数”的逻辑时，第一条语句的逻辑就变成是：按照字段a做分组，相同的a的值只返回一行。而这就是distinct的语义，所以不需要执行聚合函数时，distinct 和group by这两条语句的语义和执行流程是相同的，因此执行性能也相同。

这两条语句的执行流程是下面这样的。

创建一个临时表，临时表有一个字段a，并且在这个字段a上创建一个唯一索引；
遍历表t，依次取数据插入临时表中：
- 如果发现唯一键冲突，就跳过；
- 否则插入成功；
遍历完成后，将临时表作为结果集返回给客户端。

备库自增主键问题

除了性能问题，大家对细节的追问也很到位。在第39篇文章《自增主键为什么不是连续的？》评论区，@帽子掉了同学问到：在binlog_format=statement时，语句A先获取id=1，然后语句B获取id=2；接着语句B提交，写binlog，然后语句A再写binlog。这时候，如果binlog重放，是不是会发生语句B的id为1，而语句A的id为2的不一致情况呢？

首先，这个问题默认了“自增id的生成顺序，和binlog的写入顺序可能是不同的”，这个理解是正确的。

其次，这个问题限定在statement格式下，也是对的。因为row格式的binlog就没有这个问题了，Write row event里面直接写了每一行的所有字段的值。

而至于为什么不会发生不一致的情况，我们来看一下下面的这个例子。

create table t(id int auto_increment primary key);
insert into t values(null);

图7 insert 语句的binlog

可以看到，在insert语句之前，还有一句SET INSERT_ID=1。这条命令的意思是，这个线程里下一次需要用到自增值的时候，不论当前表的自增值是多少，固定用1这个值。

这个SET INSERT_ID语句是固定跟在insert语句之前的，比如@帽子掉了同学提到的场景，主库上语句A的id是1，语句B的id是2，但是写入binlog的顺序先B后A，那么binlog就变成：

SET INSERT_ID=2;
语句B；
SET INSERT_ID=1;
语句A；

你看，在备库上语句B用到的INSERT_ID依然是2，跟主库相同。

因此，即使两个INSERT语句在主备库的执行顺序不同，自增主键字段的值也不会不一致。

小结

今天这篇答疑文章，我选了4个好问题和你分享，并做了分析。在我看来，能够提出好问题，首先表示这些同学理解了我们文章的内容，进而又做了深入思考。有你们在认真的阅读和思考，对我来说是鼓励，也是动力。

说实话，短短的三篇答疑文章无法全部展开同学们在评论区留下的高质量问题，之后有的同学还会二刷，也会有新的同学加入，大家想到新的问题就请给我留言吧，我会继续关注评论区，和你在评论区交流。

老规矩，答疑文章也是要有课后思考题的。

在第8篇文章的评论区， @XD同学提到一个问题：他查看了一下innodb_trx，发现这个事务的trx_id是一个很大的数（281479535353408），而且似乎在同一个session中启动的会话得到的trx_id是保持不变的。当执行任何加写锁的语句后，trx_id都会变成一个很小的数字（118378）。

你可以通过实验验证一下，然后分析看看，事务id的分配规则是什么，以及MySQL为什么要这么设计呢？

你可以把你的结论和分析写在留言区，我会在下一篇文章和你讨论这个问题。感谢你的收听，也欢迎你把这篇文章分享给更多的朋友一起阅读。

上期问题时间

上期的问题是，怎么给分区表t创建自增主键。由于MySQL要求主键包含所有的分区字段，所以肯定是要创建联合主键的。

这时候就有两种可选：一种是(ftime, id)，另一种是(id, ftime)。

如果从利用率上来看，应该使用(ftime, id)这种模式。因为用ftime做分区key，说明大多数语句都是包含ftime的，使用这种模式，可以利用前缀索引的规则，减少一个索引。

这时的建表语句是：

CREATE TABLE `t` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `ftime` datetime NOT NULL,
  `c` int(11) DEFAULT NULL,
  PRIMARY KEY (`ftime`,`id`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
PARTITION BY RANGE (YEAR(ftime))
(PARTITION p_2017 VALUES LESS THAN (2017) ENGINE = MyISAM,
 PARTITION p_2018 VALUES LESS THAN (2018) ENGINE = MyISAM,
 PARTITION p_2019 VALUES LESS THAN (2019) ENGINE = MyISAM,
 PARTITION p_others VALUES LESS THAN MAXVALUE ENGINE = MyISAM);

当然，我的建议是你要尽量使用InnoDB引擎。InnoDB表要求至少有一个索引，以自增字段作为第一个字段，所以需要加一个id的单独索引。

CREATE TABLE `t` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `ftime` datetime NOT NULL,
  `c` int(11) DEFAULT NULL,
  PRIMARY KEY (`ftime`,`id`),
  KEY `id` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
PARTITION BY RANGE (YEAR(ftime))
(PARTITION p_2017 VALUES LESS THAN (2017) ENGINE = InnoDB,
 PARTITION p_2018 VALUES LESS THAN (2018) ENGINE = InnoDB,
 PARTITION p_2019 VALUES LESS THAN (2019) ENGINE = InnoDB,
 PARTITION p_others VALUES LESS THAN MAXVALUE ENGINE = InnoDB);

当然把字段反过来，创建成：

  PRIMARY KEY (`id`,`ftime`),
  KEY `id` (`ftime`)

也是可以的。

评论区留言点赞板：

@夹心面包、@郭江伟同学提到了最后一种方案。

@aliang 同学提了一个好问题，关于open_files_limit和innodb_open_files的关系，我在回复中做了说明，大家可以看一下。

@万勇提了一个好问题，实际上对于现在官方的版本，将字段加在中间还是最后，在性能上是没差别的。但是，我建议大家养成习惯（如果你是DBA就帮业务开发同学养成习惯），将字段加在最后面，因为这样还是比较方便操作的。这个问题，我也在评论的答复中做了说明，你可以看一下。

精选留言(39)

还一棵树

看到 BNL 算法，你就应该知道这条语句的执行流程其实是这样
文章中的流程是写错了？还是我理解的有问题
1、如果是a表数据放入join buffer，根据b的每一条记录去判断是否在a中如果在则保留记录
这个更像是b left join a。而不是a left join b
2、如果按照这个流程，比如a里面有2行重复的数据，如果拿b的数据在a中判断，存在则保留，那结果集只有一条数据，而按照a left join b 会出现2条结果的

作者回复 :
“如果按照这个流程，比如a里面有2行重复的数据，如果拿b的数据在a中判断，存在则保留，那结果集只有一条数据，”

不会呀，你看它是这样的：
假设join buffer中有两个行1

然后被驱动表取出一个1，
跟join buffer中第一个1比较，发现满足条件，放到结果集；
跟join buffer中第二个1比较，发现满足条件，放到结果集；

是得到两行的

2019-2-26





Dovelol

老师，看评论包括您的回复说“ left join 后加上 where 的话，肯定会被优化器优化成 join where 的形式，那是否下次写 left join ..where 的时候，不如直接写成 join .. where”，这个也是分情况的吧比如还是文章中的2张表，select * from a left join b on(a.f1=b.f1) where (a.f2=2);/*Q5*/和select * from a join b on(a.f1=b.f1) where (a.f2=2);/*Q6*/ 这个left join和join的语意和返回结果都不一样，怎么能直接写成join呢，如果是where b.f2=xx 的where条件可以直接写成join因为根据结果是不需要left的。

作者回复 : 嗯我的意思是，如果where条件里面，用到了b.f2的判断，干脆就直接写成join，不需要left join了

如果业务逻辑需要left join，就要把条件都放到on里面

业务逻辑正确性还是优先的

2019-2-25





宝玉

老师，BNl算法，如果where条件中有驱动表的过滤条件，也不会在join时候全部载入内存吧？

作者回复 : 对，驱动表现过滤，然后进join buffer

2019-2-25





千木

老师您好，join使用join_buffer和内存区别那个问题的第一点解释我还是有些纳闷，你说由于从磁盘拿数据到内存里面会导致等等的性能问题我能够理解，但是说即使使用nbl算法也会涉及到从磁盘拿数据到内存吧，所以这点导致两种算法执行差异貌似不太合理，您觉得呢？

作者回复 : BNL算法拿的数据是确定的只会拿一次（遍历一遍）
而simple nested loop join是会遍历多次的

2019-2-23





龙文

老师你好，我在第21讲求助了一个死锁问题，当时你回复说后面会解答，不过我浏览了下后续文章没找到解答，所以再次求助下。ps:用的阿里云的rds,提了工单没效果啊
作者回复: 有的，你看一下第40篇 “insert 唯一键冲突”这一段

ps:我已经离开阿里云挺久的了 😆

---------------------------------------------
谢谢老师,我看了第40篇,还是有地方不太明白,再打扰下
mysql 版本5.6
隔离级别为rc
CREATE TABLE `uk_test` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`a` int(11) NOT NULL,
`b` int(11) NOT NULL,
`c` int(11) NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `uk_a_b` (`a`,`b`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8mb4
表中数据：
+----+---+---+---+
| id | a | b | c |
+----+---+---+---+
| 1 | 1 | 1 | 2 |
| 6 | 1 | 2 | 1 |
+----+---+---+---+
sql:执行顺序
session1:begin;
session2:begin;
session1:select * from uk_test where a = 1 and b = 1 for update;
session2:select * from uk_test where a = 1 and b = 1 for update;
session1:insert into uk_test (a,b,c) values(1,1,2) on duplicate key update c = 2;
session2:ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction

我的疑问是:
1.rc隔离级别下对唯一键的insert也会加next-key lock吗？

2.死锁日志显示
session 1已经成功加上行锁(lock_mode X locks rec but not gap),

session 2在等待同一个行锁(lock_mode X locks rec but not gap waiting),

session1这时因为等待lock_mode X waiting而死锁。
这里的lock_mode X waiting是指next-key lock吗？
如果是的话，没想明白这里怎么形成资源循环等待了？
我的猜测是session1 这时持有行锁，要next-key lock 所以要去加gap锁。session 2持有gap锁在等行锁。但如果是这样为什么session2 在rc下select for update，且记录存在时会加gap锁?还有gap锁加锁不是不互斥吗？

作者回复 : 1. 会
2. 你这里
session 1 成功加锁一个record lock；

session 2执行的是一个select 语句，而且a=1 and b=1就只锁一行（a，b上有联合唯一索引），这里就是要申请一个记录行锁(but not gap waiting)。
这里虽然没有加锁成功，但是已经加入了锁队列（只是这个锁是处于等待状态）
---这时候队列里面有两个锁对象了

然后session 1 再insert失败的时候，就要加next-key lock，（注意这个锁对象跟第一个锁对象不同）。
然后死锁检测看到，2号锁在等1号锁；3号要等2号，而3和1又是同一个session，就认为是死锁了。

2019-2-23





白永伟

老师，关于备库自增id我有一个问题。既然binlog不管是statement模式还是row模式，里面的insert语句跟着的自增id都是固定的。那假如发生主备切换，备库变成主库后，客户端往新主库里插入数据时，自增id的起始值是多少，有没有可能跟已有的记录id冲突？尤其是备库还没有处理完同步过来的binlog就开始接受客户端请求时。如果要求备库必须处理完binlog才能接受客户端请求，那么怎么保证主备切换的过程中，不影响用户使用。谢谢。

作者回复 : “自增id的起始值是多少，有没有可能跟已有的记录id冲突？”
如果没有主备延迟就不会出现；

“尤其是备库还没有处理完同步过来的binlog就开始接受客户端请求时。” ，对，这种情况就会。

“如果要求备库必须处理完binlog才能接受客户端请求，那么怎么保证主备切换的过程中，不影响用户使用” 一般都是有这个要求的。要尽量减少影响，就是控制主备延迟。

2019-2-22





梦康

😂留言的人太多，辛苦老实答疑了。虽然我的问题没能被翻牌子

作者回复 : 不好意思，确实你的问题比较难一些

最近在做收尾的工作，后面一定会把问题都清理掉的哈。

你的问题质量高，是我喜欢回答的问题类型😆

2019-2-25





大宝

老师你好，看了你回复 @彼得.林时说，“在线服务最好不要让索引树超过4层“；那么有没有什么好的方法或者工具可以查看当前表的层数吗？

作者回复 : innblock 可以了解下😆

2019-4-6





彼得.林

不知道老师还会不会回复问题：
b+树索引结构的层次和表数据量的关系是怎么样的？也就是说15万的数据量是三层结构？达到多少数据量是四层次？
一般在线服务中一个表的数据量一般多大合适？

作者回复 : 你可以这么理解， N层放不下的时候，就增加一层来放。

这个行为是由页分裂触发的
在线服务最好不要让索引树超过4层

2019-3-16





yhui

我真的很迫切需要你的帮助，我是台湾人，遇到一个很神奇的问题
where in a(1,2,3,5,7,8,9) and b in(3) and c in(1,2) order by id desc
我建了一个abc联合索引，发现这语句尽然没用上联合索引很奇怪，in里删一两个值又能选对索引，这in有什么规律奥秘吗？多谢指点，我邀请我同事都买了你的课程

作者回复 : 你可否把表结构、插入数据语句都贴一下？

就是有没有稳定的复现方法（带上MySQL版本号）

2019-8-23





钱

这篇答疑很实用呀!第一个问题之前也发现有这样的现象，不过解释不清楚为什么，不过按照自己想要的也算使用对了left join 。
感谢老师，专栏接近尾声，现在回想一下，确实增加了不少见识，不过由于记忆不太好，加之有些知识消化的不好有些已经模糊啦😄
第一遍结束，再来第二遍，把实验都操作操作，应该会好一些。
感谢😊

2019-8-10





Chris

这两天在线上遇到一个比较诡异的事情，突然有几分钟连不上MySQL，通过error日志和监控的processlist显示，MySQL把很多链接都kill掉了，但处于sleep状态和show status的语句没有kill，看监控的资源使用情况不是很高，只是innodb rows read指标特别高，现在完全是没头绪了

作者回复 : 看看是不是有什么外部工具在工作

2019-3-15





龙文

明白了谢谢老师！

作者回复 : 👍

2019-2-24





龙文

老师你好，我在第21讲求助了一个死锁问题，当时你回复说后面会解答，不过我浏览了下后续文章没找到解答，所以再次求助下。ps:用的阿里云的rds,提了工单没效果啊

作者回复 : 有的，你看一下第40篇 “insert 唯一键冲突”这一段

ps:我已经离开阿里云挺久的了 😆

2019-2-23





夜空中最亮的星（华仔）

这么快就要结束，好快啊

作者回复 : 跟进得很快啊大家😆

2019-2-22





万勇

感谢老师上一期的解答，还请教一个分区表的问题，分区表创建的聚集索引是分区本地维护的吧，但是主键索引要保证全局唯一性。那分区和主键索引之间是不是要建立一种关系？另外分区表如果我们创建普通索引，按道理可以分区创建的，分区维护自己的普通索引，各分区之间互不影响。

作者回复 : 就是我这篇末尾建议的几种建表方法,就是建立联系了

2019-2-22





papaw

老师，分库分表和一主多从该如何抉择呢？最好结合场景分析下

2020-2-7





papaw

老师，mysql里in和or 有性能差别吗？查询原理是一样的吗？

2020-2-7





长期规划

老师，你讲了Innodb和Memory引擎使用场景，那MyIsam引擎呢，什么情况下会用到呢，感觉应用场景很少啊

2019-11-24





Omer

老师你好，我是一员开发同学，我花了一个月的时间疯狂从你这边补习Mysql的知识，收获很大，首先很感谢你花了那么多精力传授功力！！现在我有一个很疑惑的问题想要请教一下，希望你看到能回复，毕竟我算是很晚才来的学生了~~就是我看高性能mysql里面说的：在可重复读的隔离级别下, InnoBD只查找版本早于当前事务版本的数据行,这样可以确保事务读取的行,要么是在事务开始前已经存在,要么是事务自身插入或者修改过的。但是又看到里面说，快照读是读执行select时候已经全部提交过的最新的数据，这里难道不就跟前面那句那个事务版本的互相冲突了吗？？而且我自己也测试了，我开启一个事务A，先sleep5秒，再执行全表查询，然后在事务A查询前执行另一个事务B，往里面插入了数据，这个时候我看到事务A查出来的数据是有事务B新插入的，这就让我对前面那句事务版本产生了很大的疑惑 - -。很晚了，不知道老师您还会不会看到，希望你看到了能帮我解答一下，再次感谢你耐心传教了那么多篇好文~~

2019-10-16





papaw

老师，mysql里in和or 有性能差别吗？查询原理是一样的吗？

2020-2-7





长期规划

老师，你讲了Innodb和Memory引擎使用场景，那MyIsam引擎呢，什么情况下会用到呢，感觉应用场景很少啊

2019-11-24





Omer

老师你好，我是一员开发同学，我花了一个月的时间疯狂从你这边补习Mysql的知识，收获很大，首先很感谢你花了那么多精力传授功力！！现在我有一个很疑惑的问题想要请教一下，希望你看到能回复，毕竟我算是很晚才来的学生了~~就是我看高性能mysql里面说的：在可重复读的隔离级别下, InnoBD只查找版本早于当前事务版本的数据行,这样可以确保事务读取的行,要么是在事务开始前已经存在,要么是事务自身插入或者修改过的。但是又看到里面说，快照读是读执行select时候已经全部提交过的最新的数据，这里难道不就跟前面那句那个事务版本的互相冲突了吗？？而且我自己也测试了，我开启一个事务A，先sleep5秒，再执行全表查询，然后在事务A查询前执行另一个事务B，往里面插入了数据，这个时候我看到事务A查出来的数据是有事务B新插入的，这就让我对前面那句事务版本产生了很大的疑惑 - -。很晚了，不知道老师您还会不会看到，希望你看到了能帮我解答一下，再次感谢你耐心传教了那么多篇好文~~

2019-10-16





eden.tang

老师好，有个问题想请教一下。
实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs where ch='a'

13万
select count(*) from (select distinct(tid) from tb_logs where ch='a') t

ch为其它的数据都正常，几年下来也一直正常，今天突然数据异常，就ch='a'这个条件的数据。

2019-10-11





eden.tang

实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs

13万
select count(*) from (select distinct(tid) from tb_logs) t

2019-10-11





王斯拉

疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





王斯拉

老师同学们好，求教个问题
疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





sunshineling

请问老师Could not commit JDBC transaction mysql这个问题一般是什么情况引发的？

2019-9-11





一袋大虾

老师为什么我使用show warnings一直没有结果呢！？

2019-8-8





陈扬鸿

老师，你好，现在mysql8已经没有frm文件，一旦数据字典丢失，没有表结构就无法恢复单个ibd文件的数据，如何通过mysql8的 sdi文件生成创建表的ddl语句。

2019-6-25





400磅

老师你好，我想咨询一下我今天遇到的诡异的 Table '' doesn't exist 问题

问题描述：

在2019年5月16日下午我在我司开发环境的数据库 (192.168.1.81:3306) 上创建了一张表 v_home.verification_code 。插入了181条数据。一直到5月16日18点30左右下班表依然可用。

5月17日早上（这期间经过一次电脑的重启），我再次运行昨天的测试代码，发现报错 "Table 'v_home.verification_code' doesn't exist" 。同时使用 navicat 客户端连接数据库，发现表确实不存在了。

这时我怀疑是否是其他同事误删除了，所以在团队中询问，经反馈发现大部分同事那里是可以看到这张表 v_home.verification_code 的，这里面包括使用Mac以及Windows系统，有重新开机连接的，也有从昨天连接一直未关机的；然而还有一个使用Linux操作系统的同事，也没有这张表，我使用的是Mac；而且我们团队所有同事使用的IP端口以及账号密码都是一致的。也就是在同一时间，同一个数据库，在不同连接上出现了不一致的数据信息。

为了进一步确认，我退出navicat客户端，发现问题依然存在，然后我再次运行SQL创建了这张表，没有插入任何数据。这时我的客户端界面上出现了这张空表，同时出现的情况是以前存在这张表的同事那里没有任何变化，而使用Linux操作系统的那位同事也出现了这张空表，显示创建时间就是我刚刚操作的时间。

然后再进一步，我重新关机再启动我的电脑，连接上数据库，发现昨晚的那张表和记录都恢复了，也就是我刚刚创建表的操作像没有发生一样。为了确认是否是客户端软件的问题，我让那位依然能重现的使用Linux操作系统的同事使用mysql命令行连接数据库，连接后发现跟使用 Navicat 客户端一样，显示的还是我刚刚创建的空表。

针对此问题我没有一点头绪，虽然通过重启电脑恢复了使用，但是它是怎么发生的，是否有其他人遇到这个问题，我一无所知。

2019-5-17





Invictus_CD 

自增id还有一个bug。就是replace into的时候，假如唯一索引有冲突，主库传过来的binlog里是update，但是在主库操作的时候是先insert，这样主从的自增id那个值就会不一样。这时候主从切换也会有冲突的问题。不过这种情况发生的概率不大，除非一直replace或者刚出现一个replace数据库就主从切换了。

2019-3-26





不惑ing

您好，我看留言区@龙文问了个问题
1.rc隔离级别下对唯一键的insert也会加next-key lock吗？
您的回答是：会

我的问题：我记得前面哪篇文章里提到rc隔离级别是没有gap lock的么，我也网上用百度确认了一下是没gap lock的，前面文章还提到 next-key lock =gap lock + record lock ，所以这个回答我看的有点懵，是我哪里理解错了么？

2019-3-23





长杰

select * from a left join b on(a.f1=b.f1) where (a.f2=b.f2);
老师，这个语句是否可以理解为:先按照on后面的条件关联，获取结果集，然后对结果集用where条件进行二次过滤？

作者回复 : 要看索引哈
如果b上的索引只有f1 是的，
如果b上的索引是(f1,f2)，就两个一起关联了
【咱们文中说了，这个语句会被转成普通join哦】

2019-3-2





长杰

把表 a 的内容读入 join_buffer 中。因为是 select * ，所以字段 f1 和 f2 都被放入 join_buffer 了。

顺序扫描表 b，对于每一行数据，判断 join 条件（也就是 a.f1=b.f1 and a.f2=b.f2) 是否满足，满足条件的记录, 作为结果集的一行返回。如果语句中有 where 子句，需要先判断 where 部分满足条件后，再返回。

表 b 扫描完成后，对于没有被匹配的表 a 的行（在这个例子中就是 (1,1)、(2,2) 这两行），把剩余字段补上 NULL，再放入结果集中。

是否可以理解为:假如有where条件的情况下，对与满足on条件的行，再去过滤where条件，满足就返回；对于不满足on条件的行，b字段补Null后返回，不需要再过滤where条件

作者回复 : 不是，如果有where,并且where里面有用到b.f1或b.f2, 那就要求结果集里面没有这些null的行。

就是说where a.f2=b.f2的意思是
Where (a.f2 is not null) and (b.f2 is not null) and (a.f2 =b.f2)

2019-3-2





PYH

你好我想问一下mysql能实现oracle的拉链表么。如果能前提条件是什么？

2019-2-24





滔滔

老师您好，想请问下在innodb引擎rr隔离级别下，单独的一条update语句是不是默认就是一个事务(在执行update前不输入begin)，而单独的一条select语句是不是不会开启一个事务，哪怕是"当前读"也不会开启一个事务，更进一步，是不是对表的增删改操作默认都会开启一个事务？🤔

作者回复 : 1. 单独一个update，会启动一个事务
2. 单独一个select，也会启动一个事务
3. innodb表，增删改查都会启动一个事务

2019-2-24





发条橙子。

啧啧，原来我写的 left join 一直都不是标准的，每次后面都会加上 where ，还一直以为左面是驱动表。既然实际上 left join 后加上 where 的话，肯定会被优化器优化成 join where 的形式，那是否下次写 left join ..where 的时候，不如直接写成 join .. where ，省去优化器自己去优化，这样是不是稍稍快些

作者回复 : 是的

如果原来就有where，说明原来其实也不用left join 😆

2019-2-23





夜空中最亮的星（华仔）

订阅了好几个专栏 mysql这个是最优先看的，别的专栏可以跟不上这个必须跟上，老师计划出第二季吗？

2019-2-22





一大只😴

老师好，我做了下课后题的实验，不清楚为啥设计，下面记录了我看到的现象，不一定对哈。
使用start transaction with consistent snapshot;
同一个session的开启快照事务后的trx_id很大并且一致，如果关闭这个session，开启另一个session使用snapshot，初始值的trx_id也是与之前的session一致的。

如果再打开第二个session使用snapshot，第一次查询trx表，会发现第一个session还是很大只，第二个打开的trx_id会很小，但这个很小的trx_id是第一个打开的session的最小trx_id+1。这时，如果commit；再start snapshot，那么将会出现一个比第一个session还要大一点的trx_id，我开了几个session，第一次是+24，随后都是加12，如下图：
+---------------------+-----------------+
| trx_mysql_thread_id | trx_id |
+---------------------+-----------------+
| 14672 | 421259275839776 |
| 14661 | 421259275838864 |
| 14645 | 421259275837952 |
| 14587 | 421259275837040 |
| 14578 | 421259275835216 |
+---------------------+-----------------+

只有一个session打开snapshot情况下，trx_id在commit后会增加，但在事务内不会看到trx_id增加,使用select,select lock in share mode不会导致trx_id增加。

一个ddl操作应该是 trx_id+18

不在事务内的dml操作：
delete 1条 trx_id+2
delete 多条 trx_id+6
insert 1条 trx_id+1
insert values (),()...多条trx_id+5
update 1条 trx_id+2
update 多条 trx_id+6

snapshot事务内的dml操作：
事务内先select * from tb for update;再delete from tb where id=xxx;这样的delete trx_id+1
如果是事务内直接delete from tb where id=xxx;或delete from tb;这样的delete trx_id+6

事务内update 1条 trx_id+2，如果先select * fom tb for update;再update 1条，有时候是trx_id+2，有时候是trx_id+5
事务内update 多条 trx_id+6

作者回复 : 很好的验证
下一篇文章会讲到哈

2019-2-22





长期规划

老师，你讲了Innodb和Memory引擎使用场景，那MyIsam引擎呢，什么情况下会用到呢，感觉应用场景很少啊

2019-11-24





Omer

老师你好，我是一员开发同学，我花了一个月的时间疯狂从你这边补习Mysql的知识，收获很大，首先很感谢你花了那么多精力传授功力！！现在我有一个很疑惑的问题想要请教一下，希望你看到能回复，毕竟我算是很晚才来的学生了~~就是我看高性能mysql里面说的：在可重复读的隔离级别下, InnoBD只查找版本早于当前事务版本的数据行,这样可以确保事务读取的行,要么是在事务开始前已经存在,要么是事务自身插入或者修改过的。但是又看到里面说，快照读是读执行select时候已经全部提交过的最新的数据，这里难道不就跟前面那句那个事务版本的互相冲突了吗？？而且我自己也测试了，我开启一个事务A，先sleep5秒，再执行全表查询，然后在事务A查询前执行另一个事务B，往里面插入了数据，这个时候我看到事务A查出来的数据是有事务B新插入的，这就让我对前面那句事务版本产生了很大的疑惑 - -。很晚了，不知道老师您还会不会看到，希望你看到了能帮我解答一下，再次感谢你耐心传教了那么多篇好文~~

2019-10-16





eden.tang

老师好，有个问题想请教一下。
实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs where ch='a'

13万
select count(*) from (select distinct(tid) from tb_logs where ch='a') t

ch为其它的数据都正常，几年下来也一直正常，今天突然数据异常，就ch='a'这个条件的数据。

2019-10-11





eden.tang

实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs

13万
select count(*) from (select distinct(tid) from tb_logs) t

2019-10-11





王斯拉

疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





王斯拉

老师同学们好，求教个问题
疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





sunshineling

请问老师Could not commit JDBC transaction mysql这个问题一般是什么情况引发的？

2019-9-11





一袋大虾

老师为什么我使用show warnings一直没有结果呢！？

2019-8-8





陈扬鸿

老师，你好，现在mysql8已经没有frm文件，一旦数据字典丢失，没有表结构就无法恢复单个ibd文件的数据，如何通过mysql8的 sdi文件生成创建表的ddl语句。

2019-6-25





400磅

老师你好，我想咨询一下我今天遇到的诡异的 Table '' doesn't exist 问题

问题描述：

在2019年5月16日下午我在我司开发环境的数据库 (192.168.1.81:3306) 上创建了一张表 v_home.verification_code 。插入了181条数据。一直到5月16日18点30左右下班表依然可用。

5月17日早上（这期间经过一次电脑的重启），我再次运行昨天的测试代码，发现报错 "Table 'v_home.verification_code' doesn't exist" 。同时使用 navicat 客户端连接数据库，发现表确实不存在了。

这时我怀疑是否是其他同事误删除了，所以在团队中询问，经反馈发现大部分同事那里是可以看到这张表 v_home.verification_code 的，这里面包括使用Mac以及Windows系统，有重新开机连接的，也有从昨天连接一直未关机的；然而还有一个使用Linux操作系统的同事，也没有这张表，我使用的是Mac；而且我们团队所有同事使用的IP端口以及账号密码都是一致的。也就是在同一时间，同一个数据库，在不同连接上出现了不一致的数据信息。

为了进一步确认，我退出navicat客户端，发现问题依然存在，然后我再次运行SQL创建了这张表，没有插入任何数据。这时我的客户端界面上出现了这张空表，同时出现的情况是以前存在这张表的同事那里没有任何变化，而使用Linux操作系统的那位同事也出现了这张空表，显示创建时间就是我刚刚操作的时间。

然后再进一步，我重新关机再启动我的电脑，连接上数据库，发现昨晚的那张表和记录都恢复了，也就是我刚刚创建表的操作像没有发生一样。为了确认是否是客户端软件的问题，我让那位依然能重现的使用Linux操作系统的同事使用mysql命令行连接数据库，连接后发现跟使用 Navicat 客户端一样，显示的还是我刚刚创建的空表。

针对此问题我没有一点头绪，虽然通过重启电脑恢复了使用，但是它是怎么发生的，是否有其他人遇到这个问题，我一无所知。

2019-5-17





Invictus_CD 

自增id还有一个bug。就是replace into的时候，假如唯一索引有冲突，主库传过来的binlog里是update，但是在主库操作的时候是先insert，这样主从的自增id那个值就会不一样。这时候主从切换也会有冲突的问题。不过这种情况发生的概率不大，除非一直replace或者刚出现一个replace数据库就主从切换了。

2019-3-26





不惑ing

您好，我看留言区@龙文问了个问题
1.rc隔离级别下对唯一键的insert也会加next-key lock吗？
您的回答是：会

我的问题：我记得前面哪篇文章里提到rc隔离级别是没有gap lock的么，我也网上用百度确认了一下是没gap lock的，前面文章还提到 next-key lock =gap lock + record lock ，所以这个回答我看的有点懵，是我哪里理解错了么？

2019-3-23





长杰

select * from a left join b on(a.f1=b.f1) where (a.f2=b.f2);
老师，这个语句是否可以理解为:先按照on后面的条件关联，获取结果集，然后对结果集用where条件进行二次过滤？

作者回复 : 要看索引哈
如果b上的索引只有f1 是的，
如果b上的索引是(f1,f2)，就两个一起关联了
【咱们文中说了，这个语句会被转成普通join哦】

2019-3-2





长杰

把表 a 的内容读入 join_buffer 中。因为是 select * ，所以字段 f1 和 f2 都被放入 join_buffer 了。

顺序扫描表 b，对于每一行数据，判断 join 条件（也就是 a.f1=b.f1 and a.f2=b.f2) 是否满足，满足条件的记录, 作为结果集的一行返回。如果语句中有 where 子句，需要先判断 where 部分满足条件后，再返回。

表 b 扫描完成后，对于没有被匹配的表 a 的行（在这个例子中就是 (1,1)、(2,2) 这两行），把剩余字段补上 NULL，再放入结果集中。

是否可以理解为:假如有where条件的情况下，对与满足on条件的行，再去过滤where条件，满足就返回；对于不满足on条件的行，b字段补Null后返回，不需要再过滤where条件

作者回复 : 不是，如果有where,并且where里面有用到b.f1或b.f2, 那就要求结果集里面没有这些null的行。

就是说where a.f2=b.f2的意思是
Where (a.f2 is not null) and (b.f2 is not null) and (a.f2 =b.f2)

2019-3-2





PYH

你好我想问一下mysql能实现oracle的拉链表么。如果能前提条件是什么？

2019-2-24





滔滔

老师您好，想请问下在innodb引擎rr隔离级别下，单独的一条update语句是不是默认就是一个事务(在执行update前不输入begin)，而单独的一条select语句是不是不会开启一个事务，哪怕是"当前读"也不会开启一个事务，更进一步，是不是对表的增删改操作默认都会开启一个事务？🤔

作者回复 : 1. 单独一个update，会启动一个事务
2. 单独一个select，也会启动一个事务
3. innodb表，增删改查都会启动一个事务

2019-2-24





发条橙子。

啧啧，原来我写的 left join 一直都不是标准的，每次后面都会加上 where ，还一直以为左面是驱动表。既然实际上 left join 后加上 where 的话，肯定会被优化器优化成 join where 的形式，那是否下次写 left join ..where 的时候，不如直接写成 join .. where ，省去优化器自己去优化，这样是不是稍稍快些

作者回复 : 是的

如果原来就有where，说明原来其实也不用left join 😆

2019-2-23





夜空中最亮的星（华仔）

订阅了好几个专栏 mysql这个是最优先看的，别的专栏可以跟不上这个必须跟上，老师计划出第二季吗？

2019-2-22





一大只😴

老师好，我做了下课后题的实验，不清楚为啥设计，下面记录了我看到的现象，不一定对哈。
使用start transaction with consistent snapshot;
同一个session的开启快照事务后的trx_id很大并且一致，如果关闭这个session，开启另一个session使用snapshot，初始值的trx_id也是与之前的session一致的。

如果再打开第二个session使用snapshot，第一次查询trx表，会发现第一个session还是很大只，第二个打开的trx_id会很小，但这个很小的trx_id是第一个打开的session的最小trx_id+1。这时，如果commit；再start snapshot，那么将会出现一个比第一个session还要大一点的trx_id，我开了几个session，第一次是+24，随后都是加12，如下图：
+---------------------+-----------------+
| trx_mysql_thread_id | trx_id |
+---------------------+-----------------+
| 14672 | 421259275839776 |
| 14661 | 421259275838864 |
| 14645 | 421259275837952 |
| 14587 | 421259275837040 |
| 14578 | 421259275835216 |
+---------------------+-----------------+

只有一个session打开snapshot情况下，trx_id在commit后会增加，但在事务内不会看到trx_id增加,使用select,select lock in share mode不会导致trx_id增加。

一个ddl操作应该是 trx_id+18

不在事务内的dml操作：
delete 1条 trx_id+2
delete 多条 trx_id+6
insert 1条 trx_id+1
insert values (),()...多条trx_id+5
update 1条 trx_id+2
update 多条 trx_id+6

snapshot事务内的dml操作：
事务内先select * from tb for update;再delete from tb where id=xxx;这样的delete trx_id+1
如果是事务内直接delete from tb where id=xxx;或delete from tb;这样的delete trx_id+6

事务内update 1条 trx_id+2，如果先select * fom tb for update;再update 1条，有时候是trx_id+2，有时候是trx_id+5
事务内update 多条 trx_id+6

作者回复 : 很好的验证
下一篇文章会讲到哈

2019-2-22





克劳德

老师好，如果group by用作数据去重，根据文章中描述的，流程2会遍历表依次插入进临时表。
我理解的遍历表是通过扫描主键索引来做的，因此同一组的记录只会留下主键值最小的那个，是否正确？
能否通过扫描其他索引，来达到去重后的记录不按照主键值来决定？

作者回复 : 1.对,就是扫描这个索引的过程中,第一个碰到的值
2. 可以,你用force index试试

2019-2-22





Omer

老师你好，我是一员开发同学，我花了一个月的时间疯狂从你这边补习Mysql的知识，收获很大，首先很感谢你花了那么多精力传授功力！！现在我有一个很疑惑的问题想要请教一下，希望你看到能回复，毕竟我算是很晚才来的学生了~~就是我看高性能mysql里面说的：在可重复读的隔离级别下, InnoBD只查找版本早于当前事务版本的数据行,这样可以确保事务读取的行,要么是在事务开始前已经存在,要么是事务自身插入或者修改过的。但是又看到里面说，快照读是读执行select时候已经全部提交过的最新的数据，这里难道不就跟前面那句那个事务版本的互相冲突了吗？？而且我自己也测试了，我开启一个事务A，先sleep5秒，再执行全表查询，然后在事务A查询前执行另一个事务B，往里面插入了数据，这个时候我看到事务A查出来的数据是有事务B新插入的，这就让我对前面那句事务版本产生了很大的疑惑 - -。很晚了，不知道老师您还会不会看到，希望你看到了能帮我解答一下，再次感谢你耐心传教了那么多篇好文~~

2019-10-16





eden.tang

老师好，有个问题想请教一下。
实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs where ch='a'

13万
select count(*) from (select distinct(tid) from tb_logs where ch='a') t

ch为其它的数据都正常，几年下来也一直正常，今天突然数据异常，就ch='a'这个条件的数据。

2019-10-11





eden.tang

实际行排重后是13万，而count(distinct)确有38万为何

38万
select count(distinct(tid)) from tb_logs

13万
select count(*) from (select distinct(tid) from tb_logs) t

2019-10-11





王斯拉

疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





王斯拉

老师同学们好，求教个问题
疑问：脏页到底怎么刷
1. 根据redo log上的lsn和checkpoint lsn比较刷？
2. 根据flush-list 把最老的脏页刷入磁盘，这样就对应的redolog就可以被覆盖掉了。

猜测：

可能1：
1. 在crash的时候会用1，因为重启时内存数据不存在所以要通过redo恢复
2. 正常的刷脏页会用2，通过flush-list刷脏页更快。判断重做日志是否可覆盖，就找对应的页内容上的lsn对比即可。

可能2：
其实都是1这种方式，flush list只是为了redo更容易找脏页？

2019-9-26





sunshineling

请问老师Could not commit JDBC transaction mysql这个问题一般是什么情况引发的？

2019-9-11





一袋大虾

老师为什么我使用show warnings一直没有结果呢！？

2019-8-8





陈扬鸿

老师，你好，现在mysql8已经没有frm文件，一旦数据字典丢失，没有表结构就无法恢复单个ibd文件的数据，如何通过mysql8的 sdi文件生成创建表的ddl语句。

2019-6-25





400磅

老师你好，我想咨询一下我今天遇到的诡异的 Table '' doesn't exist 问题

问题描述：

在2019年5月16日下午我在我司开发环境的数据库 (192.168.1.81:3306) 上创建了一张表 v_home.verification_code 。插入了181条数据。一直到5月16日18点30左右下班表依然可用。

5月17日早上（这期间经过一次电脑的重启），我再次运行昨天的测试代码，发现报错 "Table 'v_home.verification_code' doesn't exist" 。同时使用 navicat 客户端连接数据库，发现表确实不存在了。

这时我怀疑是否是其他同事误删除了，所以在团队中询问，经反馈发现大部分同事那里是可以看到这张表 v_home.verification_code 的，这里面包括使用Mac以及Windows系统，有重新开机连接的，也有从昨天连接一直未关机的；然而还有一个使用Linux操作系统的同事，也没有这张表，我使用的是Mac；而且我们团队所有同事使用的IP端口以及账号密码都是一致的。也就是在同一时间，同一个数据库，在不同连接上出现了不一致的数据信息。

为了进一步确认，我退出navicat客户端，发现问题依然存在，然后我再次运行SQL创建了这张表，没有插入任何数据。这时我的客户端界面上出现了这张空表，同时出现的情况是以前存在这张表的同事那里没有任何变化，而使用Linux操作系统的那位同事也出现了这张空表，显示创建时间就是我刚刚操作的时间。

然后再进一步，我重新关机再启动我的电脑，连接上数据库，发现昨晚的那张表和记录都恢复了，也就是我刚刚创建表的操作像没有发生一样。为了确认是否是客户端软件的问题，我让那位依然能重现的使用Linux操作系统的同事使用mysql命令行连接数据库，连接后发现跟使用 Navicat 客户端一样，显示的还是我刚刚创建的空表。

针对此问题我没有一点头绪，虽然通过重启电脑恢复了使用，但是它是怎么发生的，是否有其他人遇到这个问题，我一无所知。

2019-5-17





Invictus_CD 

自增id还有一个bug。就是replace into的时候，假如唯一索引有冲突，主库传过来的binlog里是update，但是在主库操作的时候是先insert，这样主从的自增id那个值就会不一样。这时候主从切换也会有冲突的问题。不过这种情况发生的概率不大，除非一直replace或者刚出现一个replace数据库就主从切换了。

2019-3-26





不惑ing

您好，我看留言区@龙文问了个问题
1.rc隔离级别下对唯一键的insert也会加next-key lock吗？
您的回答是：会

我的问题：我记得前面哪篇文章里提到rc隔离级别是没有gap lock的么，我也网上用百度确认了一下是没gap lock的，前面文章还提到 next-key lock =gap lock + record lock ，所以这个回答我看的有点懵，是我哪里理解错了么？

2019-3-23





长杰

select * from a left join b on(a.f1=b.f1) where (a.f2=b.f2);
老师，这个语句是否可以理解为:先按照on后面的条件关联，获取结果集，然后对结果集用where条件进行二次过滤？

作者回复 : 要看索引哈
如果b上的索引只有f1 是的，
如果b上的索引是(f1,f2)，就两个一起关联了
【咱们文中说了，这个语句会被转成普通join哦】

2019-3-2





长杰

把表 a 的内容读入 join_buffer 中。因为是 select * ，所以字段 f1 和 f2 都被放入 join_buffer 了。

顺序扫描表 b，对于每一行数据，判断 join 条件（也就是 a.f1=b.f1 and a.f2=b.f2) 是否满足，满足条件的记录, 作为结果集的一行返回。如果语句中有 where 子句，需要先判断 where 部分满足条件后，再返回。

表 b 扫描完成后，对于没有被匹配的表 a 的行（在这个例子中就是 (1,1)、(2,2) 这两行），把剩余字段补上 NULL，再放入结果集中。

是否可以理解为:假如有where条件的情况下，对与满足on条件的行，再去过滤where条件，满足就返回；对于不满足on条件的行，b字段补Null后返回，不需要再过滤where条件

作者回复 : 不是，如果有where,并且where里面有用到b.f1或b.f2, 那就要求结果集里面没有这些null的行。

就是说where a.f2=b.f2的意思是
Where (a.f2 is not null) and (b.f2 is not null) and (a.f2 =b.f2)

2019-3-2





PYH

你好我想问一下mysql能实现oracle的拉链表么。如果能前提条件是什么？

2019-2-24





滔滔

老师您好，想请问下在innodb引擎rr隔离级别下，单独的一条update语句是不是默认就是一个事务(在执行update前不输入begin)，而单独的一条select语句是不是不会开启一个事务，哪怕是"当前读"也不会开启一个事务，更进一步，是不是对表的增删改操作默认都会开启一个事务？🤔

作者回复 : 1. 单独一个update，会启动一个事务
2. 单独一个select，也会启动一个事务
3. innodb表，增删改查都会启动一个事务

2019-2-24





发条橙子。

啧啧，原来我写的 left join 一直都不是标准的，每次后面都会加上 where ，还一直以为左面是驱动表。既然实际上 left join 后加上 where 的话，肯定会被优化器优化成 join where 的形式，那是否下次写 left join ..where 的时候，不如直接写成 join .. where ，省去优化器自己去优化，这样是不是稍稍快些

作者回复 : 是的

如果原来就有where，说明原来其实也不用left join 😆

2019-2-23





夜空中最亮的星（华仔）

订阅了好几个专栏 mysql这个是最优先看的，别的专栏可以跟不上这个必须跟上，老师计划出第二季吗？

2019-2-22





一大只😴

老师好，我做了下课后题的实验，不清楚为啥设计，下面记录了我看到的现象，不一定对哈。
使用start transaction with consistent snapshot;
同一个session的开启快照事务后的trx_id很大并且一致，如果关闭这个session，开启另一个session使用snapshot，初始值的trx_id也是与之前的session一致的。

如果再打开第二个session使用snapshot，第一次查询trx表，会发现第一个session还是很大只，第二个打开的trx_id会很小，但这个很小的trx_id是第一个打开的session的最小trx_id+1。这时，如果commit；再start snapshot，那么将会出现一个比第一个session还要大一点的trx_id，我开了几个session，第一次是+24，随后都是加12，如下图：
+---------------------+-----------------+
| trx_mysql_thread_id | trx_id |
+---------------------+-----------------+
| 14672 | 421259275839776 |
| 14661 | 421259275838864 |
| 14645 | 421259275837952 |
| 14587 | 421259275837040 |
| 14578 | 421259275835216 |
+---------------------+-----------------+

只有一个session打开snapshot情况下，trx_id在commit后会增加，但在事务内不会看到trx_id增加,使用select,select lock in share mode不会导致trx_id增加。

一个ddl操作应该是 trx_id+18

不在事务内的dml操作：
delete 1条 trx_id+2
delete 多条 trx_id+6
insert 1条 trx_id+1
insert values (),()...多条trx_id+5
update 1条 trx_id+2
update 多条 trx_id+6

snapshot事务内的dml操作：
事务内先select * from tb for update;再delete from tb where id=xxx;这样的delete trx_id+1
如果是事务内直接delete from tb where id=xxx;或delete from tb;这样的delete trx_id+6

事务内update 1条 trx_id+2，如果先select * fom tb for update;再update 1条，有时候是trx_id+2，有时候是trx_id+5
事务内update 多条 trx_id+6

作者回复 : 很好的验证
下一篇文章会讲到哈

2019-2-22





克劳德

老师好，如果group by用作数据去重，根据文章中描述的，流程2会遍历表依次插入进临时表。
我理解的遍历表是通过扫描主键索引来做的，因此同一组的记录只会留下主键值最小的那个，是否正确？
能否通过扫描其他索引，来达到去重后的记录不按照主键值来决定？

作者回复 : 1.对,就是扫描这个索引的过程中,第一个碰到的值
2. 可以,你用force index试试

2019-2-22





孟晓冬

老师，你好，这是表结构
CREATE TABLE `graph` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(20) NOT NULL COMMENT '报表名称',
`ip` varchar(50) DEFAULT NULL COMMENT '报表来自于哪台cat-client机器ip, NULL表示合并同domain所有ip',
`domain` varchar(50) NOT NULL COMMENT '报表处理的Domain信息',
`period` datetime NOT NULL COMMENT '报表时间段',
`type` tinyint(4) NOT NULL COMMENT '报表数据格式, 1/xml, 2/json, 3/csv, 默认3',
`detail_content` mediumtext NOT NULL COMMENT '详细绘图内容',
`summary_content` mediumtext NOT NULL COMMENT '概要绘图内容',
`creation_date` datetime NOT NULL COMMENT '报表创建时间',
PRIMARY KEY (`id`),
UNIQUE KEY `graph_period_ip_domain_name` (`period`,`ip`,`domain`,`name`)
) ENGINE=InnoDB AUTO_INCREMENT=5913464 DEFAULT CHARSET=utf8 COMMENT='小时图表曲线'
差不多有600万条记录，我删除完550万条记录后，执行select min(id) from graph;比较慢
root@localhost:cat 09:01:06> select min(id) from graph;
+---------+
| min(id) |
+---------+
| 5513664 |
+---------+
1 row in set (8.27 sec)
然后做了alter table graph ENGINE=InnoDB;这个操作后，就快了，
root@localhost:cat 09:06:20> select min(id) from graph;
+---------+
| min(id) |
+---------+
| 5513664 |
+---------+
1 row in set (0.00 sec)
这是为什么呀？

作者回复 : 看下13篇

2019-2-22



