mysql 聚簇索引和非聚簇索引的區別
聚簇索引和非聚簇索引的區別:聚簇索引的葉子節點就是數據節點,而非聚簇索引的葉子節點仍然是索引節點,只不過有指向對應數據塊的指針。
mysql 中不同的數據存儲引擎對聚簇索引的支持不同,我們可以看一下 mysql 中 myisam 和 innodb 兩種引擎的索引結構。
假如原始數據如下:
1. myisam 引擎的數據存儲方式
myisam 是按列值與行號來組織索引的。它的葉子節點中保存的實際上是指向存放數據的物理塊的指針。從 myisam 存儲的物理文件我們能看出,myisam 引擎的索引文件(.myi)和數據文件(.myd)是相互獨立的。
2. innodb 引擎的數據存儲方式
innodb 按聚簇索引的形式存儲數據,所以它的數據布局有著很大的不同。
聚簇索引中的每個葉子節點包含主鍵值、事務id、回滾指針(rollback pointer用于事務和mvcc)和余下的列(如col2)。
innodb 的二級索引與主鍵索引有很大的不同。innodb 的二級索引的葉子包含主鍵值,而不是行指針(row pointers),這減小了移動數據或者數據頁面分裂時維護二級索引的開銷,因為 innodb 不需要更新索引的行指針。其結構大致如下:
innodb和myisam的主鍵索引與二級索引的對比:
innodb的的二級索引的葉子節點存放的是key字段加主鍵值。因此,通過二級索引查詢首先查到是主鍵值,然后innodb再根據查到的主鍵值通過主鍵索引找到相應的數據塊。而myisam的二級索引葉子節點存放的還是列值與行號的組合,葉子節點中保存的是數據的物理地址。所以可以看出myisam的主鍵索引和二級索引沒有任何區別,主鍵索引僅僅只是一個叫做primary的唯一、非空的索引,且myisam引擎中可以不設主鍵。
3. 聚簇索引的優缺點
優點:
- 可以把相關數據保存在一起,數據訪問就更快。
- 聚簇索引將索引和數據保存在同一個b-tree中,因此獲取數據比非聚簇索引要更快。
- 使用聚簇索引掃描的查詢可以直接使用頁節點中的主鍵值。
缺點:
- 聚簇索引最大程度提高了io密集型應用的性能,如果數據全部在內存中將失去優勢。
- 更新聚簇索引列的代價很高,因為會強制每個被更新的行移動到新位置。
- 基于聚簇索引的表插入新行或主鍵被更新導致行移動時,可能導致頁分裂,表會占用更多磁盤空間。
- 當行稀疏或由于頁分裂導致數據存儲不連續時,全表掃描可能很慢。
4. 創建索引示例
建立索引之前選好表對象,假設表名為 indextesttable,此表中包含三個字段 id,name,uniquecode。為了更快的進行姓名查詢,我們可以在 name 字段上添加非聚簇索引。
創建索引的格式如下:
create nonclustered index [index_name【索引名稱】] on [table_name【表名稱】]([column_name1【列名稱】],[column_name2【列名稱】],...);
我們給 indextesttable 表的 name 字段添加一個非聚簇索引:
create nonclustered index indextesttable_index_name on indextesttable(name);
給 indextesttable 表的 uniquecode 字段添加一個聚簇索引:
create clustered index indextesttable_index_uniquecode on indextesttable(uniquecode)
這是最簡單最直接的設置索引的方式,而通常實際應用中,會有多字段聯合添加索引的情況,這個就需要根據實際的應用查詢場景,以及在 where 條件下最常用的查詢字段。
例如:在 tablex 中你最經常查詢的條件:
select name,message from tablex where 1=1 and deptid='003523' and limitedcondition='somevalue'
這個時候你就可以 添加一個基于 deptid 和 limitedcondition 兩個字段的非聚簇索引,以便于加速查詢速度。
create nonclustered index tablex_index_departid_limitedcondition on tablex(deptid,limitedcondition);