mysql 聚簇索引和非聚簇索引的區別

聚簇索引和非聚簇索引的區別：聚簇索引的葉子節點就是數據節點，而非聚簇索引的葉子節點仍然是索引節點，只不過有指向對應數據塊的指針。

mysql 中不同的數據存儲引擎對聚簇索引的支持不同，我們可以看一下 mysql 中 myisam 和 innodb 兩種引擎的索引結構。

假如原始數據如下：

1. myisam 引擎的數據存儲方式

myisam 是按列值與行號來組織索引的。它的葉子節點中保存的實際上是指向存放數據的物理塊的指針。從 myisam 存儲的物理文件我們能看出，myisam 引擎的索引文件（.myi）和數據文件(.myd)是相互獨立的。

2. innodb 引擎的數據存儲方式

innodb 按聚簇索引的形式存儲數據，所以它的數據布局有著很大的不同。

聚簇索引中的每個葉子節點包含主鍵值、事務id、回滾指針(rollback pointer用于事務和mvcc）和余下的列(如col2)。

innodb 的二級索引與主鍵索引有很大的不同。innodb 的二級索引的葉子包含主鍵值，而不是行指針(row pointers)，這減小了移動數據或者數據頁面分裂時維護二級索引的開銷，因為 innodb 不需要更新索引的行指針。其結構大致如下：

innodb和myisam的主鍵索引與二級索引的對比：

innodb的的二級索引的葉子節點存放的是key字段加主鍵值。因此，通過二級索引查詢首先查到是主鍵值，然后innodb再根據查到的主鍵值通過主鍵索引找到相應的數據塊。而myisam的二級索引葉子節點存放的還是列值與行號的組合，葉子節點中保存的是數據的物理地址。所以可以看出myisam的主鍵索引和二級索引沒有任何區別，主鍵索引僅僅只是一個叫做primary的唯一、非空的索引，且myisam引擎中可以不設主鍵。

3. 聚簇索引的優缺點

優點：

可以把相關數據保存在一起，數據訪問就更快。
聚簇索引將索引和數據保存在同一個b-tree中，因此獲取數據比非聚簇索引要更快。
使用聚簇索引掃描的查詢可以直接使用頁節點中的主鍵值。

缺點：

聚簇索引最大程度提高了io密集型應用的性能，如果數據全部在內存中將失去優勢。
更新聚簇索引列的代價很高，因為會強制每個被更新的行移動到新位置。
基于聚簇索引的表插入新行或主鍵被更新導致行移動時，可能導致頁分裂，表會占用更多磁盤空間。
當行稀疏或由于頁分裂導致數據存儲不連續時，全表掃描可能很慢。

4. 創建索引示例

建立索引之前選好表對象，假設表名為 indextesttable，此表中包含三個字段 id，name，uniquecode。為了更快的進行姓名查詢，我們可以在 name 字段上添加非聚簇索引。

創建索引的格式如下：

create nonclustered index [index_name【索引名稱】] on [table_name【表名稱】]([column_name1【列名稱】],[column_name2【列名稱】],...);

我們給 indextesttable 表的 name 字段添加一個非聚簇索引：

create nonclustered index indextesttable_index_name on indextesttable(name);

給 indextesttable 表的 uniquecode 字段添加一個聚簇索引：

create clustered index indextesttable_index_uniquecode on indextesttable(uniquecode)

這是最簡單最直接的設置索引的方式，而通常實際應用中，會有多字段聯合添加索引的情況，這個就需要根據實際的應用查詢場景，以及在 where 條件下最常用的查詢字段。

例如：在 tablex 中你最經常查詢的條件：

select name，message 
from tablex 
where 1=1 
and deptid='003523' 
and limitedcondition='somevalue'

這個時候你就可以添加一個基于 deptid 和 limitedcondition 兩個字段的非聚簇索引，以便于加速查詢速度。

create nonclustered index tablex_index_departid_limitedcondition 
on tablex(deptid,limitedcondition);

下一節：mysql 主鍵索引和聚簇索引的區別

mysql 教程

學習MySQL