Mysql区分度很差是否有必要建索引

一般而言区分度很差的字段没必要建索引,但是这种也要视情况而定。

原因

存储引擎底层,我们经常听到,不走索引而走全表扫描。那么底层为什么不走索引而走全表扫描。

这里涉及到聚集索引和非聚集索引,对于非聚集索引值,查询的字段如果包含非索引字段,就会通过聚集索引主键从聚集索引中查询出需要查询出来的数据,也就是我们常说的回表。

回表的结果就是不仅需要扫描一次索引表,还要回表查询完整数据,这里就会造成,全表扫描甚至比走索引还要快。

什么情况可以建索引

这里其实可以考虑一点,如果查询出来的数据的结果,相对于全表而言较小,那么回表的速度是不是比全表扫描的速度快。所以考虑是否建立索引,那就考虑 查询的结果集与全部数据集的比值

场景

  • 不建索引的场景
    • 查询性别(性别要么是男,要么是女,数据基本5 5开)
  • 建立索引的场景
    • 状态扭转(支付状态,我们数据最终都会是失败或者成功,但是我们大部分操作的是支付中的数据)