>  기사  >  데이터 베이스  >  hive中使用标准sql实现分组内排序

hive中使用标准sql实现分组内排序

WBOY
WBOY원래의
2016-06-07 14:58:482401검색

hive中使用标准sql实现分组内排序 在hive中,想要实现分组内排序,一般都是自己写udf实现oracle中分析函数row_number() over(partition)的功能,如果不使用自定义udf,仅使用标准sql实现的话,毫无性能可言,仅做实验而已。 方便起见,以下语句为oracle中语句

hive中使用标准sql实现分组内排序

 

在hive中,想要实现分组内排序,一般都是自己写udf实现oracle中分析函数row_number() over(partition)的功能,如果不使用自定义udf,仅使用标准sql实现的话,毫无性能可言,仅做实验而已。

 

方便起见,以下语句为oracle中语句,但都属于标准sql,在hive中亦可:

 

Sql代码  

CREATE TABLE lxw_t (user_id VARCHAR2(20),  

class VARCHAR2(20),  

score NUMBER   

);  

 

Sql代码  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','语文','90');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','数学','86');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','英语','96');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_1','体育','77');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','语文','88');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','数学','65');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','英语','67');  

INSERT INTO liuxiaowen.lxw_t VALUES ('user_2','体育','98');  

  

commit;  

 

Sql代码  

SELECT x.user_id,x.class,x.score,COUNT(1) AS seq   

FROM (  

  SELECT a.*,b.score score2 FROM   

  liuxiaowen.lxw_t a ,  

  liuxiaowen.lxw_t b   

  WHERE a.user_id = b.user_id (+)   

) x   

WHERE x.score2 >= x.score --按照成绩由高到低排列  

--WHERE x.score >= x.score2  --按照成绩由低到高排列  

GROUP BY x.user_id,x.class,x.score   

order BY 1,4   

 

按照成绩由高到低排列的结果如下:

 

Sql代码  

USER_ID CLASS   SCORE   SEQ  

user_1  英语  96  1  

user_1  语文  90  2  

user_1  数学  86  3  

user_1  体育  77  4  

user_2  体育  98  1  

user_2  语文  88  2  

user_2  英语  67  3  

user_2  数学  65  4  

 

按照成绩由低到高排列的结果如下:

 

Sql代码  

USER_ID CLASS   SCORE   SEQ  

user_1  体育  77  1  

user_1  数学  86  2  

user_1  语文  90  3  

user_1  英语  96  4  

user_2  数学  65  1  

user_2  英语  67  2  

user_2  语文  88  3  

user_2  体育  98  4  

 

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.