>데이터 베이스 >MySQL 튜토리얼 >SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?

SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?

Barbara Streisand
Barbara Streisand원래의
2025-01-01 05:00:09677검색

How Does SparkSQL Handle Subqueries Across Different Versions?

SparkSQL 하위 쿼리 지원

SparkSQL은 버전 2.0 이상에서 상관 및 비상관 하위 쿼리를 완벽하게 지원합니다. 하지만 2.0 이전 버전에서는 Spark의 하위 쿼리 지원이 제한되었습니다.

FROM 절에 있는 하위 쿼리의 경우 Spark는 Hive와 동일한 방식으로 지원합니다(버전 <= 0.12).

SELECT col FROM (SELECT *  FROM t1 WHERE bar) t2

단, 스파크 2.0 이전 버전에서는 WHERE절 서브쿼리가 지원되지 않았습니다. 이는 성능 문제와 모든 하위 쿼리가 JOIN을 사용하여 표현될 수 있다는 사실 때문이었습니다.

Spark 2.0 이상에서는 상관된 하위 쿼리와 상관되지 않은 하위 쿼리가 모두 지원됩니다. 예는 다음과 같습니다.

SELECT * FROM l WHERE exists (SELECT * FROM r WHERE l.a = r.c)
SELECT * FROM l WHERE l.a in (SELECT c FROM r)

그러나 2.0 이전 버전에서는 DataFrame DSL을 사용하여 하위 쿼리를 표현하는 것이 현재 불가능하다는 점에 유의하는 것이 중요합니다.

위 내용은 SparkSQL은 다양한 버전의 하위 쿼리를 어떻게 처리합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.