Spark SQL의 복잡한 창 기능을 사용하여 사용자 활성 날짜 찾기
질문:
웹사이트에 로그인한 사용자의 기록이 포함된 DataFrame입니다. 사용자가 활동하는 시기를 결정하고 활동 기간을 고려해야 합니다. 이 기간 이후에 사용자가 다시 로그인하면 활성 날짜가 재설정됩니다.
제안 방법:
히스테리시스 및 재귀 기능이 있는 윈도우 기능을 사용하여 활동 기간 내 첫 번째 로그인 또는 가장 최근 로그인을 식별하여 활동 날짜를 결정합니다.
Spark 네이티브 솔루션(>= 3.2):
Spark 3.2 이상에서는 세션 창을 지원합니다. 사용 예는 공식 문서를 참조하세요.
레거시 솔루션(Spark
-
가져오기 기능:
-
Window
은 창을 정의하는 데 사용됩니다 -
coalesce
,datediff
,lag
,lit
,min
,sum
-
-
정의 창:
-
userWindow
user_name
으로 분할하고login_date
으로 정렬
-
userSessionWindow
user_name
및session
에 의한 파티션
-
-
새 세션의 시작 찾기:
-
datediff
,lag
을 이용하여 로그인 날짜를 비교하고, 활동 기간보다 큰 공백이 있는지 확인해보세요. -
cast
을 사용하여 결과를bigint
로 변환합니다. - 새 세션 시작을 누적하려면
userWindow
에서sum
을 사용하세요.
-
-
각 세션의 가장 빠른 날짜 찾기:
-
withColumn
열을 추가하려면session
을 사용하세요. - 각 세션의 가장 빠른
userSessionWindow
을 찾으려면min
의login_date
을 사용하세요. -
session
열을 삭제하세요.
-
-
예:
val df = Seq( ("SirChillingtonIV", "2012-01-04"), ("Booooooo99900098", "2012-01-04"), ("Booooooo99900098", "2012-01-06"), ("OprahWinfreyJr", "2012-01-10"), ("SirChillingtonIV", "2012-01-11"), ("SirChillingtonIV", "2012-01-14"), ("SirChillingtonIV", "2012-08-11") ).toDF("user_name", "login_date") val result = sessionized //sessionized is assumed to be defined elsewhere, this is a crucial part missing from the original .withColumn("became_active", min($"login_date").over(userSessionWindow)) .drop("session") df.show(5) result.show(5)
이 솔루션을 완성하는 데 중요한 부분인 sessionized
정의가 예제 코드에서 누락되었습니다. session
열은 활동 기간과 로그인 날짜를 기준으로 계산해야 합니다. 이를 위해서는 일반적으로 사용자 정의 함수나 더 복잡한 창 함수 논리가 필요합니다. 완전한 솔루션을 위해서는 누락된 코드 조각을 추가해야 합니다.
위 내용은 창 함수를 사용하여 Spark SQL에서 사용자 활성 날짜를 확인하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사는 MySQL의 Alter Table 문을 사용하여 열 추가/드롭 테이블/열 변경 및 열 데이터 유형 변경을 포함하여 테이블을 수정하는 것에 대해 설명합니다.

기사는 인증서 생성 및 확인을 포함하여 MySQL에 대한 SSL/TLS 암호화 구성에 대해 설명합니다. 주요 문제는 자체 서명 인증서의 보안 영향을 사용하는 것입니다. [문자 수 : 159]

기사는 MySQL에서 파티셔닝, 샤딩, 인덱싱 및 쿼리 최적화를 포함하여 대규모 데이터 세트를 처리하기위한 전략에 대해 설명합니다.

기사는 MySQL Workbench 및 Phpmyadmin과 같은 인기있는 MySQL GUI 도구에 대해 논의하여 초보자 및 고급 사용자를위한 기능과 적합성을 비교합니다. [159 자].

이 기사에서는 Drop Table 문을 사용하여 MySQL에서 테이블을 떨어 뜨리는 것에 대해 설명하여 예방 조치와 위험을 강조합니다. 백업 없이는 행동이 돌이킬 수 없으며 복구 방법 및 잠재적 생산 환경 위험을 상세하게합니다.

기사는 외국 열쇠를 사용하여 데이터베이스의 관계를 나타내고 모범 사례, 데이터 무결성 및 피할 수있는 일반적인 함정에 중점을 둡니다.

이 기사에서는 PostgreSQL, MySQL 및 MongoDB와 같은 다양한 데이터베이스에서 JSON 열에서 인덱스를 작성하여 쿼리 성능을 향상시킵니다. 특정 JSON 경로를 인덱싱하는 구문 및 이점을 설명하고 지원되는 데이터베이스 시스템을 나열합니다.

기사는 준비된 명령문, 입력 검증 및 강력한 암호 정책을 사용하여 SQL 주입 및 무차별 적 공격에 대한 MySQL 보안에 대해 논의합니다 (159 자)


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구
