在 PostgreSQL 中作为主键的 UUID 是否会给索引性能带来不良影响？

小开

最佳答案

(我在 Heroku Postgres 工作)

我们在一些系统上使用 UUID 作为主键，它工作得很好。

我建议您使用 uuid-ossp扩展，甚至让 postgres 为您生成 UUID:

heroku pg:psql
psql (9.1.4, server 9.1.6)
SSL connection (cipher: DHE-RSA-AES256-SHA, bits: 256)
Type "help" for help.


dcvgo3fvfmbl44=> CREATE EXTENSION "uuid-ossp";
CREATE EXTENSION
dcvgo3fvfmbl44=> CREATE TABLE test (id uuid primary key default uuid_generate_v4(), name text);
NOTICE:  CREATE TABLE / PRIMARY KEY will create implicit index "test_pkey" for table "test"
CREATE TABLE
dcvgo3fvfmbl44=> \d test
Table "public.test"
Column | Type |              Modifiers
--------+------+-------------------------------------
id     | uuid | not null default uuid_generate_v4()  name   | text |
Indexes:
"test_pkey" PRIMARY KEY, btree (id)


dcvgo3fvfmbl44=> insert into test (name) values ('hgmnz');
INSERT 0 1
dcvgo3fvfmbl44=> select * from test;
id                  | name
--------------------------------------+-------
e535d271-91be-4291-832f-f7883a2d374f | hgmnz
(1 row)

编辑性能影响

它将 一直都是取决于您的工作负载。

整数主键具有局部性的优势，其中 like-data 位置更靠近。这对于诸如 WHERE id between 1 and 10000之类的范围类型查询很有帮助，尽管锁争用更加严重。

如果您的读取工作负载是完全随机的，因为您总是进行主键查找，那么不应该有任何可测量的性能下降: 您只需为更大的数据类型付费。

你给这张桌子写了很多东西吗? 这张桌子很大吗？有可能，虽然我还没有测量过，维持这个指数还是有意义的。但是对于许多数据集来说，UUID 就很好了，并且使用 UUID 作为标识符有一些很好的属性。

最后，我可能不是最合适的人来讨论或建议这一点，因为我从来没有运行一个表足够大的 UUID PK 已成为一个问题。YMMV.(话虽如此，我还是很乐意听到有人在这种方法上遇到问题!)