MySQL: 选择 DISTINCT/UNIQUE,但返回所有列?

SELECT DISTINCT field1, field2, field3, ......
FROM table;

我试图完成下面的 SQL 语句,但是我希望它返回 所有柱子
Is this possible?

就像这样:

SELECT DISTINCT field1, *
FROM table;
1035316 次浏览
SELECT  c2.field1 ,
field2
FROM    (SELECT DISTINCT
field1
FROM   dbo.TABLE AS C
) AS c1
JOIN dbo.TABLE AS c2 ON c1.field1 = c2.field1

您正在寻找一个由:

select *
from table
group by field1

偶尔也可以用不同的on语句来写:

select distinct on field1 *
from table

然而,在大多数平台上,上述两种方法都不能工作,因为其他列上的行为未指定。(第一种方法适用于MySQL,如果你使用的是MySQL的话。)

您可以获取不同的字段,并坚持每次选择任意一行。

在一些平台上(例如PostgreSQL, Oracle, T-SQL),这可以直接使用窗口函数完成:

select *
from (
select *,
row_number() over (partition by field1 order by field2) as row_number
from table
) as rows
where row_number = 1

在其他(MySQL, SQLite)上,你需要编写子查询,这将使你将整个表与其本身(例子)连接起来,所以不建议。

从您的问题措辞中,我了解到您希望为给定字段选择不同的值,并为每个这样的值列出同一行中的所有其他列值。大多数dbms不允许使用DISTINCTGROUP BY,因为结果是不确定的。

可以这样想:如果你的field1出现了不止一次,field2的值将被列出(假设你在两行中有相同的field1值,但在这两行中有两个不同的field2值)。

然而,你可以使用聚合函数(显式地为你想显示的每个字段),并使用GROUP BY而不是DISTINCT:

SELECT field1, MAX(field2), COUNT(field3), SUM(field4), ....
FROM table GROUP BY field1
SELECT * from table where field in (SELECT distinct field from table)

你可以用WITH子句来实现。

例如:

WITH c AS (SELECT DISTINCT a, b, c FROM tableName)
SELECT * FROM tableName r, c WHERE c.rowid=r.rowid AND c.a=r.a AND c.b=r.b AND c.c=r.c

这也允许你只选择在WITH子句查询中选择的行。

如果我没理解错的话,你的问题和我刚才遇到的问题很相似。您希望能够将DISTINCT的可用性限制在指定的字段,而不是将其应用于所有数据。

如果你使用GROUP BY而没有聚合函数,你GROUP BY的字段将是你的DISTINCT字段。

如果你有疑问:

SELECT * from table GROUP BY field1;

它将显示基于field1的单个实例的所有结果。

例如,如果您有一个包含名称、地址和城市的表。一个人有多个地址记录,但你只想要这个人的一个地址,你可以这样查询:

SELECT * FROM persons GROUP BY name;

结果将是该名称的一个实例及其地址将出现,而另一个实例将从结果表中被省略。注意:如果你的字段有原子值,如firstName, lastName,你想要分组。

SELECT * FROM persons GROUP BY lastName, firstName;

因为如果两个人有相同的姓氏,而你只按姓氏分组,那么其中一个人将从结果中被忽略。你需要考虑到这些事情。希望这能有所帮助。

只需将所有字段包含在GROUP BY子句中。

SELECT *
FROM tblname
GROUP BY duplicate_values
ORDER BY ex.VISITED_ON DESC
LIMIT 0 , 30

ORDER BY中,我刚刚在这里放了一个例子,你也可以在这里添加ID字段

SELECT DISTINCT FIELD1, FIELD2, FIELD3 FROM TABLE1,如果这三列的值在表中都是唯一的。

例如,如果您的名字有多个相同的值,但所选列中的姓和其他信息不同,则该记录将包含在结果集中。

将GROUP BY添加到要检查重复的字段 您的查询可能看起来像

SELECT field1, field2, field3, ......   FROM table GROUP BY field1

将检查Field1以排除重复记录

或者你可能会问

SELECT *  FROM table GROUP BY field1

字段1的重复记录被排除在SELECT中

对于SQL Server,您可以使用dense_rank和其他窗口函数来获取指定列上具有重复值的所有行和列。这里有一个例子……

with t as (
select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r1' union all
select col1 = 'c', col2 = 'b', col3 = 'a', other = 'r2' union all
select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r3' union all
select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r4' union all
select col1 = 'c', col2 = 'b', col3 = 'a', other = 'r5' union all
select col1 = 'a', col2 = 'a', col3 = 'a', other = 'r6'
), tdr as (
select
*,
total_dr_rows = count(*) over(partition by dr)
from (
select
*,
dr = dense_rank() over(order by col1, col2, col3),
dr_rn = row_number() over(partition by col1, col2, col3 order by other)
from
t
) x
)


select * from tdr where total_dr_rows > 1

这是对col1、col2和col3的每个不同组合进行行计数。

它可以通过内部查询来完成

$query = "SELECT *
FROM (SELECT field
FROM table
ORDER BY id DESC) as rows
GROUP BY field";

好问题@aryaxt——你可以看出这是一个好问题,因为你5年前问过这个问题,而我今天在试图找到答案时偶然发现了它!

我只是试图编辑接受的答案,以包括这一点,但如果我的编辑没有使它:

如果你的表不是那么大,并且假设你的主键是一个自动递增的整数,你可以这样做:

SELECT
table.*
FROM table
--be able to take out dupes later
LEFT JOIN (
SELECT field, MAX(id) as id
FROM table
GROUP BY field
) as noDupes on noDupes.id = table.id
WHERE
//this will result in only the last instance being seen
noDupes.id is not NULL

这是一个非常好的问题。我已经在这里读到了一些有用的答案,但也许我可以补充一个更精确的解释。

只要不查询额外的信息,使用GROUP BY语句减少查询结果的数量是很容易的。让我们假设你有以下表“位置”。

--country-- --city--
France      Lyon
Poland      Krakow
France      Paris
France      Marseille
Italy       Milano

现在是查询

SELECT country FROM locations
GROUP BY country

会导致:

--country--
France
Poland
Italy

但是,下面的查询

SELECT country, city FROM locations
GROUP BY country

...在MS SQL中抛出一个错误,因为你的计算机怎么知道你想在“法国”右边的字段中阅读三个法国城市“里昂”、“巴黎”或“马赛”中的哪一个呢?

为了纠正第二个查询,必须添加此信息。一种方法是使用MAX()或MIN()函数,从所有候选值中选择最大或最小的值。MAX()和MIN()不仅适用于数值,还可以比较字符串值的字母顺序。

SELECT country, MAX(city) FROM locations
GROUP BY country

会导致:

--country-- --city--
France      Paris
Poland      Krakow
Italy       Milano

或者:

SELECT country, MIN(city) FROM locations
GROUP BY country

会导致:

--country-- --city--
France      Lyon
Poland      Krakow
Italy       Milano

只要您愿意从字母(或数字)顺序的两端选择值,这些函数就是一个很好的解决方案。但如果事实并非如此呢?让我们假设您需要一个具有特定特征的值,例如以字母“M”开头。现在事情变得复杂了。

到目前为止,我能找到的唯一解决方案是把你的整个查询放到一个子查询中,并在它外面手工构造额外的列:

SELECT
countrylist.*,
(SELECT TOP 1 city
FROM locations
WHERE
country = countrylist.country
AND city like 'M%'
)
FROM
(SELECT country FROM locations
GROUP BY country) countrylist

会导致:

--country-- --city--
France      Marseille
Poland      NULL
Italy       Milano

我建议使用

SELECT  * from table where field1 in
(
select distinct field1 from table
)

这样,如果field1在多个行中有相同的值,将返回所有记录。

试一试

SELECT table.* FROM table
WHERE otherField = 'otherValue'
GROUP BY table.fieldWantedToBeDistinct
limit x
select min(table.id), table.column1
from table
group by table.column1

这是一个简单的解决方法:

 WITH cte AS /* Declaring a new table named 'cte' to be a clone of your table */
(SELECT *, ROW_NUMBER() OVER (PARTITION BY id ORDER BY val1 DESC) AS rn
FROM MyTable /* Selecting only unique values based on the "id" field */
)
SELECT * /* Here you can specify several columns to retrieve */
FROM cte
WHERE rn = 1

这样可以得到2个唯一的列,只有一个查询 select Distinct col1,col2 from '{path}' group by col1,col2 如果需要,可以增加列