>  기사  >  데이터 베이스  >  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

jacklove
jacklove원래의
2018-06-14 16:48:016091검색

순위 기능은 SQL Server2005의 새로운 기능입니다. 다음은 각각의 사용법과 차이점을 간략하게 소개합니다. 새로운 Order 테이블을 생성하고 효과를 확인할 수 있도록 일부 초기 데이터를 추가합니다.

테이블 구조 및 초기 데이터 Sql

첨부된 것은 테이블 구조 및 초기 데이터 다이어그램입니다. 1. ROW _NUMBER

 목적 of row_number 매우 광범위하며 정렬에 사용하는 것이 가장 좋습니다. 일반적으로 웹 프로그램에서 페이징을 구현하는 데 사용할 수 있습니다. 쿼리된 레코드의 각 행에 대해 일련 번호를 생성하고 중복 없이 정렬합니다. row_number 함수를 사용할 때 반드시 over 절을 사용해야 일련번호를 생성하기 위해 정렬할 열을 선택해야 합니다. Row_number 사용 예: 네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

select ROW_NUMBER() OVER(order by [SubTime] desc) as row_num,* from [Order]

쿼리 결과는 다음과 같습니다.



그림의 row_num 열은 에 의해 생성된 일련번호 열 기본적으로 row_number 함수는 over 절의 정렬 문을 먼저 사용하여 레코드를 정렬한 다음 이 순서대로 일련 번호를 생성하는 것이 원칙입니다.

over 절의 order by 절은 SQL 문의 order by 절과 아무 관련이 없습니다. 두 위치의 order by는 완전히 다를 수 있습니다 예를 들어 다음 SQL에서는 over 절이 다음과 같이 배열됩니다. SubTime에 따라 내림차순으로 Sql 문에서 TotalPrice를 기준으로 내림차순으로 정렬합니다.


select ROW_NUMBER() OVER(order by [SubTime] desc) as row_num,* from [Order] order by [TotalPrice] desc


  查询结果如下图所示:

  over子句和sql语句中的order by 可完全不同-晓菜鸟

  利用row_number可以实现web程序的分页,我们来查询指定范围的表数据。例:根据订单提交时间倒序排列获取第三至第五条数据。


with orderSection as(    select ROW_NUMBER() OVER(order by [SubTime] desc) rownum,* from [Order])select * from [orderSection] where rownum between 3 and 5 order by [SubTime] desc


  查询结果如下图所示:

  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

  注意:在使用row_number实现分页时需要特别注意一点,over子句中的order by 要与Sql排序记录中的order by 保持一致,否则得到的序号可能不是连续的。下面我们写一个例子来证实这一点,将上面Sql语句中的排序字段由SubTime改为TotalPrice。另外提一下,对于带有子查询和CTE的查询,子查询和CTE查询有序并不代表整个查询有序,除非显示指定了order by。


with orderSection as(    select ROW_NUMBER() OVER(order by [SubTime] desc) rownum,* from [Order])select * from [orderSection] where rownum between 3 and 5 order by [TotalPrice] desc


  查询结果如下图所示:

  over子句中的order by 与sql排序的order by 不一致-晓菜鸟

  

二、RANK

  rank函数用于返回结果集的分区内每行的排名, 行的排名是相关行之前的排名数加一。简单来说rank函数就是对查询出来的记录进行排名,与row_number函数不同的是,rank函数考虑到了over子句中排序字段值相同的情况,如果使用rank函数来生成序号,over子句中排序字段值相同的序号是一样的,后面字段值不相同的序号将跳过相同的排名号排下一个,也就是相关行之前的排名数加一,可以理解为根据当前的记录数生成序号,后面的记录依此类推。可能我描述的比较苍白,理解起来也比较吃力,我们直接上代码,rank函数的使用方法与row_number函数完全相同。


select RANK() OVER(order by [UserId]) as rank,* from [Order]


  查询结果如下图所示:

  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

  由上图可以看出,rank函数在进行排名时,同一组的序号是一样的,而后面的则是根据当前的记录数依次类推,图中第一、二条记录的用户Id相同,所以他们的序号是一样的,第三条记录的序号则是3。  

 

三、DENSE_RANK

  dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第四名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。将上面的Sql语句改由dense_rank函数来实现。


select DENSE_RANK() OVER(order by [UserId]) as den_rank,* from [Order]


  查询结果如下图所示:

  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

  图中第一、二条记录的用户Id相同,所以他们的序号是一样的,第三条记录的序号紧接上一个的序号,所以为2不为3,后面的依此类推。

四、NTILE

  ntile函数可以对序号进行分组处理,将有序分区中的行分发到指定数目的组中。 各个组有编号,编号从一开始。 对于每一个行,ntile 将返回此行所属的组的编号。这就相当于将查询出来的记录集放到指定长度的数组中,每一个数组元素存放一定数量的记录。ntile函数为每条记录生成的序号就是这条记录所有的数组元素的索引(从1开始)。也可以将每一个分配记录的数组元素称为“桶”。ntile函数有一个参数,用来指定桶数。下面的SQL语句使用ntile函数对Order表进行了装桶处理:


select NTILE(4) OVER(order by [SubTime] desc) as ntile,* from [Order]


  查询结果如下图所示:

  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

  Order表的总记录数是6条,而上面的Sql语句ntile函数指定的组数是4,那么Sql Server2005是怎么来决定每一组应该分多少条记录呢?这里我们就需要了解ntile函数的分组依据(约定)。

  ntile函数的分组依据(约定):

  1、每组的记录数不能大于它上一组的记录数,即编号小的桶放的记录数不能小于编号大的桶。也就是说,第1组中的记录数只能大于等于第2组及以后各组中的记录数。

  2、所有组中的记录数要么都相同,要么从某一个记录较少的组(命名为X)开始后面所有组的记录数都与该组(X组)的记录数相同。也就是说,如果有个组,前三组的记录数都是9,而第四组的记录数是8,那么第五组和第六组的记录数也必须是8。

  这里对约定2进行详细说明一下,以便于更好的理解。

  首先系统会去检查能不能对所有满足条件的记录进行平均分组,若能则直接平均分配就完成分组了;若不能,则会先分出一个组,这个组分多少条记录呢?就是 (总记录数/总组数)+1 条,之所以分配 (总记录数/总组数)+1 条是因为当不能进行平均分组时,总记录数%总组数肯定是有余的,又因为分组约定1,所以先分出去的组需要+1条。

  分完之后系统会继续去比较余下的记录数和未分配的组数能不能进行平均分配,若能,则平均分配余下的记录;若不能,则再分出去一组,这个组的记录数也是(总记录数/总组数)+1条。

  然后系统继续去比较余下的记录数和未分配的组数能不能进行平均分配,若能,则平均分配余下的记录;若还是不能,则再分配出去一组,继续比较余下的......这样一直进行下去,直至分组完成。

  举个例子,将51条记录分配成5组,51%5==1不能平均分配,则先分出去一组(51/5)+1=11条记录,然后比较余下的 51-11=40 条记录能否平均分配给未分配的4组,能平均分配,则剩下的4组,每组各40/4=10 条记录,分配完成,分配结果为:11,10,10,10,10,晓菜鸟我开始就错误的以为他会分配成 11,11,11,11,7。

  根据上面的两个约定,可以得出如下的算法:

 


네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

//mod表示取余,p表示取整.if(记录总数 mod 桶数==0)
{
  recordCount=记录总数 p 桶数;
  //将每桶的记录数都设为recordCount.}else{
  recordCount1=记录总数 p 桶数+1;
  int n=1;//n表示桶中记录数为recordCount1的最大桶数.  m=recordCount1*n;  while(((记录总数-m) mod (桶数- n)) !=0)
  {
    n++;
    m=recordCount1*n;
  }
  recordCount2=(记录总数-m) p (桶数-n);
  //将前n个桶的记录数设为recordCount1.  //将n+1个至后面所有桶的记录数设为recordCount2.}

네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

 

 NTILE()函数算法实现代码

  

  根据上面的算法,如果总记录数为59,总组数为5,则 n=4 , recordCount1=12 , recordCount2=11,分组结果为 :12,12,12,12,11。

  如果总记录数为53,总组数为5,则 n=3 , recordCount1=11 , recordCount2=10,分组结果为:11,11,11,10,10。

  就拿上面的例子来说,总记录数为6,总组数为4,通过算法得到 n=2 , recordCount1=2 , recordCount2=1,分组结果为:2,2,1,1。

 


select ntile,COUNT([ID]) recordCount from (    select NTILE(4) OVER(order by [SubTime] desc) as ntile,* from [Order]) as tgroup by t.ntile


 

  运行Sql,分组结果如图:

  네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개

  比对算法与Sql Server的分组结果是一致的,说明算法没错。:)

 

总结:

在使用排名函数的时候需要注意以下三点:

 1. 순위 함수에는 OVER 절이 있어야 합니다.

 2. 순위 함수에는 ORDER BY를 포함하는 OVER 절이 있어야 합니다.

  3. 그룹 내에서 1개부터 정렬합니다.

이 글에서는 SQL의 4가지 주요 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE)와 관련된 지식을 설명합니다. 더 많은 관련 내용을 보려면 PHP 중국어 웹사이트를 참고하세요.

관련 추천:

Mysql 공통 벤치마킹 도구

Mysql 함수 관련 설명

SQLLite 관련 내용

위 내용은 네 가지 주요 SQL 순위 함수(ROW_NUMBER, RANK, DENSE_RANK, NTILE) 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.