聚簇索引和非聚簇索引

11/11/2024

|

865 字

|

2 分钟阅读

"AI摘要: 本文介绍了聚簇索引和非聚簇索引在MySQL中的物理存储方式。聚簇索引将表的索引和数据存放在一起，而非聚簇索引则分开存放。文章进一步分析了这两种索引结构在查询和修改操作中的性能差异：聚簇索引在查询时速度更快，但修改时可能导致B+树分裂和合并，非聚簇索引则相对耗时较少。"

聚簇索引/非聚簇索引并非是一种类似主键索引的逻辑上的索引结构，而是物理存储方式。以MySQL为例，Innodb引擎采用的就是聚簇索引，而myisam则是非聚簇索引。

我们从文件名来对比聚簇索引和非聚簇索引的物理结构：

Innodb的存储文件为：.frm和.idb, 前者存储表的结构，后者存储表内部数据的索引和数据
MyISAM的存储文件为：.frm、.myd、myyi, 分别存储表的结构、表的数据和表的索引

很明显可以看出来，所谓是否聚簇就是表的索引和数据是否存放在一起。

在更加深入idb的内部细节，如下图，叶子节点存储着数据和索引

而.myd和.myYI的内部细节，如下图，叶子节点存储着索引和数据的地址，如果想要拿到真正的地址，是需要拿着地址到.myd文件中二次查找。

我们继续从查询和修改两个角度分析两种物理存储的优缺点：

查询：
- 聚簇索引：只需要一次查找就能找到数据
- 非聚簇索引：一次查找只能拿到数据的地址，需要再用地址进行二次查找，速度略慢
修改：如果我们修改了索引的键，可能会导致导致B+树的分裂和合并
- 聚簇索引：叶子节点的分裂和合并需要挪动数据本身和索引，比较耗时
- 非聚簇索引：叶子节点的分裂和合并只需要挪动数据的地址和索引，比较快，修改代价小

相关推荐

AI Slop：当内容成本趋近于零，我们已经没有回头路

AI Slop：当内容成本趋近于零，我们已经没有回头路

2023年之后，关于AI的叙事在网络上呈现出一种奇特的二元结构。一边是AGI狂欢。每一款新模型发布，都会引发一轮”人类职业消亡倒计时”的刷屏。OpenAI的发布会，已经有了苹果当年春晚级别的仪式感，围观者屏息等待那几个benchmark数字——仿佛只要曲线向右上角弯折，AGI奇点就在明天。另一边，是一些值得关注的反思。Andrej Karpathy最近在播客里说，他现在用AI生成的文章做初步筛选——不是为了获取信息，而是为了找到那些”没被AI写过”的东西。Gary Marcus多次公开讨论”AI生成内容的质量均值在向平均水平收敛”。

6/27/2026·6 分钟

Vibe Coding 的泡沫，从何而来？

Vibe Coding 的泡沫，从何而来？

在如今 Vibe Coding 火热到近乎全民讨论的时候，说这些话大概难免会引来不少反对的声音。不过这篇文章并不是想否定 Vibe Coding，它确实是一项重要的技术进步。我更想讨论的是：**为什么今天很多人对它产生了近乎无限的期待？** 也许几年以后，当这波浪潮过去，后人来挖坟再看今天的讨论，会有不同的理解。

6/26/2026·6 分钟