数据库 MySQL 用 UUID 作为主键，实际使用中有什么问题

kgen · 2015年03月06日 · 最后由 oxffff 回复于 2015年04月02日 · 34046 次阅读

本帖已被管理员设置为精华贴

最近有一个产品尝试采用 UUID 代替默认的 int 主键。

由于没有在大规模的生产环境中这样用过，虽然搜索了关于 MySQL UUID 主键的优劣势文章，但毕竟案例还是太少，很多还停留在性能测试阶段。

论坛中是否有朋友在生产环境中采用过 ActiveRecord + MySQL UUID 主键的方案，有没有什么特别的坑？

13 个赞

无引用文章

在 Rails 中生成全局唯一 ID 的最佳实践是什么？ Schema 与数据类型优化小技巧

foxzool #0 2015年03月06日

还没在生产环境试过。不过看网上资料，主键的字段类型设置引起不同的性能变化 postgresql 的 uuid 比 text 省空间 http://simononsoftware.com/how-to-store-uuids-in-postgresql/ SO 上关于 mysql 的两篇文章 http://stackoverflow.com/questions/412341/how-should-i-store-guid-in-mysql-tables http://stackoverflow.com/questions/2365132/uuid-performance-in-mysql/2365176

kgen #1 2015年03月07日

#1 楼 @foxzool 嗯，谢谢！这些文章我都看过，为了不干扰回答者的倾向性，所以我没有在主贴贴出来。主要还是想听听大家实践的成果。

cuterxy #2 2015年03月07日

我的理解，UUID 的优势就是天然适应高并发的环境下使用。如果 id 顺序递增，每创建一条记录都需要对表加一次锁，这在高并发环境下是很大的开销，有时候甚至是不能容忍的。

1 个赞

kgen #3 2015年03月07日

#3 楼 @cuterxy 是的，在并行插入下，理论上 UUID 的确有优势。但是纯性能测试中，它的插入性能随着数据量指数级减慢。

1 个赞

cuterxy #4 2015年03月07日

#4 楼 @kgen 插入性能随数据量指数级减慢的原因是你只在单机上进行测试。而 UUID 可以无痛支持对表进行水平划分，将数据分布存储在多台不同的机器上。只要机器可以无限扩展，插入性能就能够得到保证。

1 个赞

ywjno #5 2015年03月07日

感觉应该没什么问题吧

vincent #6 2015年03月07日

没有这样用过，不过从 innodb 存储特性看，这种做法非常不可取，如果数据量很大，可能导致严重的性能问题，主要原因有：

innodb 的非主键索引都将存一个主键，uuid 相比整数 id，索引大小增加很多；
uuid 主键比较肯定比整数慢，另外非主键索引查找最终还要引用一次主键查找；
innodb 主键索引和数据存储位置相关（簇类索引），uuid 主键可能会引起数据位置频繁变动，严重影响性能。

12 个赞

taomaree #7 2015年03月07日

新浪微博的主键采用的是自己设计的 UUID 算法。参考 http://www.infoq.com/cn/articles/online-data-migration-experience

1 个赞

kgen #8 2015年03月07日

#5 楼 @cuterxy 非常感谢指出单机测试的局限性，我们用分布式的环境再测一下。

kgen #9 2015年03月07日

#7 楼 @vincent 嗯，UUID 索引变大和簇类索引引起数据位置频繁变动，的确是我们最担心的。你们有没有小项目尝试过 UUID 做主键？

kgen #10 2015年03月07日

#8 楼 @taomaree 赞，看了 id generator 的源码，原理都差不多，但是 weibo 的确根据自己的业务指标，搞了个最适合自己的。

vincent #11 2015年03月07日

#10 楼 @kgen 我们还没有尝试过，：）

jimrokliu #12 2015年03月08日

我们做过类似的处理，但不是 UUID，是用 redis 产生 id。因为我的程序需要高写入，所以先要生成内存中的缓存对象，然后再用异步程序进行处理。我不用 UUID 是因为会失去了时间顺序的排列，一些地方可以简单的根据 id 排序来得到时间序列。这在后端构造 redis 的 zset 时候有时候有很大的方便。

kgen #13 2015年03月09日

#13 楼 @jimrokliu 借助 redis 生成 id 后，稍后写入主 DB，的确是个好办法，感谢提供思路

huobazi #14 2015年03月09日

像 twitter 那样搞就可以了

imwildcat #15 2015年03月10日

刚发了个贴请教同样的问题，自己的小项目。然后又搜到此贴，看了看回复，想了下，不如直接 MongoDB 算了～

limanxian #16 2015年03月11日

用 UUID 比较占地方，效率方面不同的数据库可能不一样，优点是比较独立，迁移不受影响。

huobazi #17 2015年03月11日

看看 csdn 论坛又换回来了

kgen #18 2015年03月11日

#18 楼 @huobazi CSDN 曾经用 UUID 的？好，我去查查他们为什么后来不用了。

huobazi #19 2015年03月11日

#19 楼 @kgen 应该是 @robbin 重构的时候，换成 int 了

20 楼已删除

ery #21 2015年03月12日

@kgen 你的问题，让我想起了我们曾经的一个问题。我们采用 UUID 作为 mysql 数据库的辅助键，而不是主键，主键依然是 Int ID 我们的情况可能不一样，为了说明我们的情况我写了这个帖子，为支持移动端离线模式 - 数据库采用 UUID 字段

2 个赞

kgen #22 2015年03月12日

#23 楼 @ery 看完了你那篇遗留系统转向支持 UUID 的实战经历，感谢分享。另外，文采很好，幽默

ulricqin #23 2015年03月17日

最近遇到一个场景跟楼主的问题有点参考性。我们有很大量的数据要处理，此时如果用数字就可以很方便分区，新数据是大 ID，使用新机器处理，也方便扩容。但是我们现在的数据 identity 是 md5，这样容易分区（比如按照 md5 的第一个字符）但是不好扩容了，因为新数据仍然落在 MD5 这个大的 key 空间中

h3110w0r1d #24 2015年03月19日

主键肯定应该是 int 型的，uuid 不符合要求楼主可以搜索下 flickr 的分布式 ticket server，就是一句 mysql 语句，充当类似 oracle 的 sequence 功能，专门用来生成全局唯一的数字

ruohanc #25 2015年03月19日

从我的使用经验上面来说，mysql 的主键还是保持默认 int 比较好，对数据迁移什么的比较友好，如果真需要 uuid，不妨切换到支持更好的 postgres 或者 mongodb 吧。

huobazi #26 2015年03月19日

这帖子还热着啊，uuid 太占地方了！！！！

twitter Instagram flickr 都用的 bigint 并且不用表级别的自动生成其中 flickr 用的 mysql 的 replace into 来取巧计算 Instagram 是写了个 postgres sql 函数根据时间戳、服务器、序列来自动计算 twitter id 构成基本同 instagram 用的是 erlang

twitter 和 Instagram 的 id 结构类似内含时间戳并且序列增加易按时间和大小排序和分隔，

ruby 里关于 twitter flake 的实现一堆一堆的

我在用了很久了 http://nongmin365.com/items/30809134504869920

7 个赞