加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 钦州站长网 (https://www.0777zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

MySQL表为什么必须有主键 - 关于聚集索引的简介

发布时间:2022-12-13 10:55:51 所属栏目:MySql教程 来源:
导读:  为什么能提高插入性能呢,避免page分页又是怎么回事?

  这里就不得不说一下聚集索引了。

  聚集索引(Clustered Index)

  一个聚集索引定义了表中数据的物理存储顺序。如何理解聚集索引呢,
  为什么能提高插入性能呢,避免page分页又是怎么回事?
 
  这里就不得不说一下聚集索引了。
 
  聚集索引(Clustered Index)
 
  一个聚集索引定义了表中数据的物理存储顺序。如何理解聚集索引呢,好比一个电话本,比如一个电话本是按照姓氏排序,并且电话号码紧跟着后面。因为聚集索引决定了表中数据的物理存储顺序,那么一个表则有且只有一个聚集索引。一个聚集索引可以包含多个列。好比一个电话本是基于名字,姓氏同时排序。
 
  Innodb的聚集索引
 
  Innodb的存储索引是基于B+tree,理所当然,聚集索引也是基于B+tree。与非聚集索引的区别则是,聚集索引既存储了索引,也存储了行值。当一个表有一个聚集索引,它的数据是存储在索引的叶子页(leaf pages)。因此innodb也能理解为基于索引的表。
 
  * 那么Innodb如何决定那个索引作为聚集索引呢?*
 
  Innodb如何选择一个聚集索引
 
  对于Innodb,主键毫无疑问是一个聚集索引。但是当一个表没有主键,或者没有一个索引,Innodb会如何处理呢。请看如下规则
 
  如果一个主键被定义了,那么这个主键就是作为聚集索引
 
  如果没有主键被定义,那么该表的第一个唯一非空索引被作为聚集索引
 
  如果没有主键也没有合适的唯一索引,那么innodb内部会生成一个隐藏的主键作为聚集索引,这个隐藏的主键是一个6个字节的列,改列的值会随着数据的插入自增。
 
  还有一个需要注意的是:
 
  次级索引的叶子节点并不存储行数据的物理地址。而是存储的该行的主键值。
 
  所以:一次级索引包含了两次查找。一次是查找次级索引自身。然后查找主键(聚集索引)
 
  现在应该明白了吧,建立自增主键的原因是:
 
  Innodb中的每张表都会有一个聚集索引,而聚集索引又是以物理磁盘顺序来存储的,自增主键会把数据自动向后插入,避免了插入过程中的聚集索引排序问题。聚集索引的排序,必然会带来大范围的数据的物理移动,这里面带来的磁盘IO性能损耗是非常大的。
 
  而如果聚集索引上的值可以改动的话,那么也会触发物理磁盘上的移动mysql索引表,于是就可能出现page分裂,表碎片横生。
 
  解读中的第二点相信看了上面关于聚集索引的解释后就很清楚了。
 
  虽然遵循上面的原则也没错,但某些特殊的情况也是可以自己指定一些非自增主键为聚集索引的。如:
 
  举个例子,(只是例子啊,现实中不太可能):
 
  有一家公司里的员工上百万,有关员工的个人信息几年都不会发生变化,那么以员工的user_id号来作为各个表的索引就很适合。因为一个员工的信息都按照物理顺序呢排列在一起了,避免了磁盘移动查找数据的IO时间。比如说员工属于几个部门,一下子就查到了,不同分不同的地址去挨个进行磁盘扫描。
 

(编辑:PHP编程网 - 钦州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!