EXISTS 与 JOIN 及 EXISTS 子句的使用

下面是代码示例:

CREATE TABLE #titles(
title_id       varchar(20),
title          varchar(80)       NOT NULL,
type           char(12)          NOT NULL,
pub_id         char(4)               NULL,
price          money                 NULL,
advance        money                 NULL,
royalty        int                   NULL,
ytd_sales      int                   NULL,
notes          varchar(200)          NULL,
pubdate        datetime          NOT NULL
)
GO


insert #titles values ('1', 'Secrets',   'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
insert #titles values ('2', 'The',       'business',     '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
insert #titles values ('3', 'Emotional', 'psychology',   '0736', $7.99,  $4000.00, 10, 3336,'Note 3','06/12/91')
insert #titles values ('4', 'Prolonged', 'psychology',   '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
insert #titles values ('5', 'With',      'business',     '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
insert #titles values ('6', 'Valley',    'mod_cook',     '0877', $19.99, $0.00,    12, 2032,'Note 6','06/09/91')
insert #titles values ('7', 'Any?',      'trad_cook',    '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
insert #titles values ('8', 'Fifty',     'trad_cook',    '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
GO




CREATE TABLE #sales(
stor_id        char(4)           NOT NULL,
ord_num        varchar(20)       NOT NULL,
ord_date       datetime          NOT NULL,
qty            smallint          NOT NULL,
payterms       varchar(12)       NOT NULL,
title_id       varchar(80)
)
GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482',    '09/14/94', 10, 'Net 60',    '1')
insert #sales values('3', 'N914008',  '09/14/94', 20, 'Net 30',    '2')
insert #sales values('4', 'N914014',  '09/14/94', 25, 'Net 30',    '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')




SELECT    title, price
FROM      #titles
WHERE     EXISTS
(SELECT   *
FROM      #sales
WHERE     #sales.title_id = #titles.title_id
AND       qty >30)




SELECT    t.title, t.price
FROM     #titles t
inner join #sales s on t.title_id = s.title_id
where s.qty >30

我想知道上述两个查询之间的区别是什么,它们给出了相同的结果。还想知道 EXISTS 关键字的用途和具体在哪里使用?

125123 次浏览

EXISTS主要用于快捷方式。从本质上讲,一旦条件为真,优化器就会退出,因此它可能不需要扫描整个表(在现代版本的 SQL Server 中,这种优化也可以发生在 IN()上,尽管并不总是如此)。此行为可能因查询而异,在某些情况下,联接实际上可能为优化器提供更多执行其工作的机会。因此,我认为很难说“这是你应该使用 EXISTS的时候,而这是你不应该使用的时候”,因为,像很多事情一样,“这取决于。”

也就是说,在这种情况下,由于表之间基本上是1:1的匹配,所以不太可能看到任何性能差异,优化器可能会生成类似甚至相同的计划。当您为每个标题添加50,000行时,如果比较加入/存在,您可能会看到一些不同的东西(不要介意您需要更改您的加入查询以删除重复、聚合等等)。

EXISTS用于返回一个布尔值,JOIN返回一个完整的其他表

EXISTS仅用于测试子查询是否返回结果,并且一旦返回就会短路。JOIN用于扩展结果集,方法是将结果集与另一个与之有关系的表中的其他字段组合在一起。

在您的示例中,这些查询在语义上是等价的。

一般情况下,在下列情况下使用 EXISTS:

  • 不需要从相关表返回数据
  • 在相关的表中存在欺骗(如果值重复,JOIN可能导致重复的行)
  • 您想要检查是否存在(使用而不是 LEFT OUTER JOIN...NULL条件)

如果有适当的索引,大多数情况下,EXISTS的性能将与 JOIN完全相同。异常发生在非常复杂的子查询上,在这种情况下使用 EXISTS通常更快。

如果你的 JOIN关键是没有索引,它可能会更快地使用 EXISTS,但你需要测试你的具体情况。

JOIN语法通常也更容易阅读和清晰。

我发现,当我想根据行与其他行的交互方式排除行时,“存在”是最有用的。

比如说,

SELECT *
FROM TABLE a
WHERE a.val IN (1,2,3)
AND NOT EXISTS(SELECT NULL
FROM TABLE b
WHERE b.id = a.id
AND b.val NOT IN (1, 2, 3))

在这种情况下,我在 a查询中排除了一行,这是基于具有相同 id 但无效的 b记录。

这其实来自 我工作上的生产问题。查询将大部分排除逻辑移动到查询中而不是应用程序中,从而将加载时间从24秒以上缩短到2秒以下。:-)

  • EXISTS 是一个半连接
  • JOIN 就是 JOIN

3行5行匹配

  • JOIN 给出了15行
  • EXISTS 给出3行

其结果是其他人提到的“短路”效应,不需要对 JOIN 使用 DISTINCT。在1: n 关系的 n 端查找行的存在性时,EXISTS 几乎总是更快。