sql中筛选第一条记录【分组排序】

问题描述

我们现在有一张表titles,共有4个字段,分别是emp_no(员工编号),title(职位),from_date(起始时间),to_date(结束时间),记录的是员工在某个时间段内职位名称,因为会存在升职,转岗之类的,里面emp_no可能会对应多个职位,我们现在要取到所有员工最近的职位信息,包括离职员工。


本文介绍两种方法去实现结果:

方法一

嵌套一个group by+max()子查询获取最近的职位信息。

思路
  1. 通过对emp_no分组取每个emp_no对应的最大的from_date;
SELECT
    emp_no,
    max( from_date ) AS max_date 
FROM
    titles 
GROUP BY
    emp_no

结果如下:
sql中筛选第一条记录【分组排序】

  1. 通过查询出来的最大的from_date取筛选最近的的一条职位信息。
SELECT
    t.emp_no,
    t.title 
FROM
    titles t
    LEFT JOIN ( SELECT emp_no, max( from_date ) AS max_date FROM titles GROUP BY emp_no ) et 
ON t.emp_no = et.emp_no AND t.from_date = et.max_date

结果如下:
sql中筛选第一条记录【分组排序】


方法二

通过rank over partition by函数实现,这个目前是Oracle独有的函数,如果你用的是mysql或者sql server就没办法使用了。

语法

功能:在原有表的基础上加上一个根据条件排序的伪列。

SELECT
    *,
     RANK() OVER (PARTITION BY emp_no ORDER BY from_date DESC) AS rank
FROM
    titles

RANK() OVER (PARTITION BY emp_no ORDER BY from_date DESC) AS rank表示把表根据emp_no进行分区,然后在分区内根据from_date进行降序排列,排序结果生成一列命名为rank。
我们之前在问题里面提到了一个emp_no会对应多条职位信息,然后对于每个emp_no的记录进行一个降序排列,接下来我们只需要把上面的结果当成一个子查询然后筛选rank = 1 就好了。

完整代码如下
SELECT
    * 
FROM
    ( SELECT *, RANK ( ) OVER ( PARTITION BY emp_no ORDER BY from_date DESC ) AS rank FROM titles ) r 
WHERE
    r.rank = '1'

由于我笔记本只装了mysql的环境,所以就没法给各位展示效果了。


综上,如果各位目前使用的是Oracle,推荐各位使用方法二:

  • 方法二容错率高,如果titles表里面有两条记录emp_no和from_date都是一样的,方法一就会报错了,单条子查询返回多行;
  • 方法二还可以实现取第二条,第三条等等的记录,方法一只有一个最大或者最小可供选择。

peace~

相关推荐