>데이터 베이스 >MySQL 튜토리얼 >SQL의 RANK 함수(ROW_NUMBER, RANK, DENSE_RANK, LEAD, LAG)를 R에서 어떻게 복제할 수 있나요?

SQL의 RANK 함수(ROW_NUMBER, RANK, DENSE_RANK, LEAD, LAG)를 R에서 어떻게 복제할 수 있나요?

Susan Sarandon
Susan Sarandon원래의
2024-12-31 16:41:09763검색

How Can I Replicate SQL's RANK Functions (ROW_NUMBER, RANK, DENSE_RANK, LEAD, LAG) in R?

R에서 SQL의 순위 함수 에뮬레이션

R에서 동등한 순위 함수

데이터입니다. 테이블 패키지는 Oracle의 SQL 순위와 유사한 기능을 제공합니다. function.

  • ROW_NUMBER(): 이 함수를 모방하는 것은 간단합니다.
  • RANK(): data.table의 순위(x, ties.method = "min")은 Oracle의 것과 유사합니다. RANK().
  • DENSE_RANK(): 값을 요소로 변환하고 정수 값을 반환하여 이 함수를 모방합니다.

순위 함수 사용 예

library(data.table)

DT <- data.table(ID = seq_len(4 * 3),
                 group = rep(1:4, each = 3),
                 value = rnorm(4 * 3),
                 info = c(sample(c("a", "b"), 4 * 2, replace = TRUE),
                           sample(c("c", "d"), 4, replace = TRUE)),
                 key = "ID")

DT[, valRank := rank(-value), by = "group"]

DENSE_RANK 모방

DT[, infoRank := rank(info, ties.method = "min"), by = "group"]
DT[, infoRankDense := as.integer(factor(info)), by = "group"]

LEAD 및 LAG 모방

그룹 내 ID 순서에 따라 순위 변수를 생성합니다. 그런 다음 J()를 사용하여 이전 또는 후속 레코드에서 값을 검색합니다.

DT[, idRank := rank(ID), by = "group"]
setkey(DT, group, idRank)

DT[, prev := DT[J(group, idRank - 1), value, mult = 'last']]

LEAD의 경우 idRank에 적절한 오프셋을 추가하고 multi = 'first':

DT[, nex := DT[J(group, idRank + 1), value, mult = 'first']]
를 사용합니다.

위 내용은 SQL의 RANK 함수(ROW_NUMBER, RANK, DENSE_RANK, LEAD, LAG)를 R에서 어떻게 복제할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.