PostgreSQL 임의 행 선택 방법
기존의 무작위 행 선택 방법은 수백만 또는 수십억 개의 레코드가 포함된 대규모 테이블을 처리할 때 비효율적이고 속도가 느립니다. 두 가지 일반적인 방법은 다음과 같습니다.
-
random()
을 사용하여 필터링:select * from table where random() < 0.001;
-
order by random()
및limit
사용:select * from table order by random() limit 1000;
그러나 전체 테이블 스캔이나 정렬이 필요하기 때문에 이러한 방법은 행 수가 많은 테이블에는 최선의 선택이 아니며 성능 병목 현상을 일으킬 수 있습니다.
대형 테이블의 최적화 방법
다음 유형의 테이블의 경우 훨씬 더 빠른 다음 최적화 방법을 고려하십시오.
- 작은 또는 중간 간격의 숫자 ID 열(더 빠른 조회를 위해 색인화됨)
- 선택 중 쓰기 작업이 없거나 최소한입니다
쿼리:
WITH params AS ( SELECT 1 AS min_id, -- 可选:自定义最小ID起始值 5100000 AS id_span -- 近似ID范围(最大ID - 最小ID + 缓冲) ) SELECT * FROM ( SELECT DISTINCT 1 + trunc(random() * p.id_span)::integer AS id FROM params p, generate_series(1, 1100) g GROUP BY 1 ) r INNER JOIN big ON r.id = big.id LIMIT 1000;
작동 방식:
-
ID 범위 추정:
- 정확히 알 수 없는 경우 테이블을 쿼리하여 ID 열의 최소, 최대 및 전체 범위(최대 - 최소)를 추정하세요.
-
임의의 ID 생성:
- 예상 ID 범위 내에서 다른 난수 세트를 생성합니다.
-
중복 및 중복 제거:
- 생성된 번호를 그룹화하여 중복된 번호를 제거하면 누락된 행이나 이미 선택한 행을 선택할 가능성이 줄어듭니다.
-
테이블 조인 및 제한:
- ID 열을 사용하여 실제 테이블과 난수를 결합합니다(인덱싱해야 함). 이 효율적인 조인은 선택한 행에 해당하는 데이터를 검색합니다.
- 마지막으로 제한을 적용하여 필요한 행 수를 검색합니다.
빠른 이유:
-
최소 인덱스 사용:
- 쿼리는 ID 열에 대해서만 인덱스 스캔을 수행하며 이는 전체 테이블 스캔이나 정렬 작업보다 훨씬 빠릅니다.
-
최적화된 난수 생성:
- 생성된 난수는 추정 ID 범위에 걸쳐 분포되어 행이 누락되거나 겹칠 가능성을 최소화합니다.
-
중복 및 중복 제거:
- 생성된 숫자를 그룹화하면 고유한 행만 선택되므로 중복을 제거하기 위해 추가 필터링이나 결합이 필요하지 않습니다.
기타 옵션:
-
간격 처리를 위한 재귀 CTE:
- ID 순서에 공백이 있는 테이블의 경우 추가 CTE를 추가하여 이러한 공백을 처리하세요.
-
재사용을 위한 함수 래퍼:
- 한도 및 간격 비율을 매개변수로 사용하는 함수를 정의하여 다른 테이블에서 쉽게 구성하고 재사용할 수 있도록 합니다.
-
모든 테이블에 대한 범용 기능:
- 정수 열이 있는 모든 테이블을 매개변수로 받아들이는 일반 함수를 만듭니다.
-
속도를 위한 뷰 구체화:
- 임의로 선택된 (준) 행을 더 빠르게 검색하려면 최적화된 쿼리를 기반으로 구체화된 뷰를 생성하는 것이 좋습니다.
-
PostgreSQL 9.5의
TABLE SAMPLE
:- PostgreSQL의 "
TABLE SAMPLE SYSTEM
" 기능을 활용하여 더 빠르지만 무작위가 적은 행 샘플링 방법을 구현하여 정확한 수의 행이 반환되도록 합니다. 그러나 클러스터링 효과로 인해 표본이 완전히 무작위가 아닐 수도 있다는 점에 유의하세요.
- PostgreSQL의 "
위 내용은 대규모 PostgreSQL 테이블에서 무작위 행을 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사에서는 MySQL의 "공유 라이브러리를 열 수 없음"오류를 다룹니다. 이 문제는 MySQL이 필요한 공유 라이브러리 (.so/.dll 파일)를 찾을 수 없음에서 비롯됩니다. 솔루션은 시스템 패키지 M을 통한 라이브러리 설치 확인과 관련이 있습니다.

이 기사는 Docker에서 MySQL 메모리 사용을 최적화합니다. 모니터링 기술 (Docker Stats, Performance Schema, 외부 도구) 및 구성 전략에 대해 설명합니다. 여기에는 Docker 메모리 제한, 스와핑 및 CGroups와 함께 포함됩니다

이 기사는 MySQL의 Alter Table 문을 사용하여 열 추가/드롭 테이블/열 변경 및 열 데이터 유형 변경을 포함하여 테이블을 수정하는 것에 대해 설명합니다.

이 기사는 Linux에 MySQL을 직접 설치하는 것과 Phpmyadmin이없는 Podman 컨테이너 사용을 비교합니다. 각 방법에 대한 설치 단계에 대해 자세히 설명하면서 Podman의 격리, 이식성 및 재현성의 장점을 강조하지만 또한

이 기사는 자체 포함 된 서버리스 관계형 데이터베이스 인 SQLITE에 대한 포괄적 인 개요를 제공합니다. SQLITE의 장점 (단순성, 이식성, 사용 용이성) 및 단점 (동시성 제한, 확장 성 문제)에 대해 자세히 설명합니다. 기음

기사는 인증서 생성 및 확인을 포함하여 MySQL에 대한 SSL/TLS 암호화 구성에 대해 설명합니다. 주요 문제는 자체 서명 인증서의 보안 영향을 사용하는 것입니다. [문자 수 : 159]

이 안내서는 Homebrew를 사용하여 MacOS에 여러 MySQL 버전을 설치하고 관리하는 것을 보여줍니다. 홈 브루를 사용하여 설치를 분리하여 갈등을 방지하는 것을 강조합니다. 이 기사에는 설치, 서비스 시작/정지 서비스 및 Best Pra에 대해 자세히 설명합니다

기사는 MySQL Workbench 및 Phpmyadmin과 같은 인기있는 MySQL GUI 도구에 대해 논의하여 초보자 및 고급 사용자를위한 기능과 적합성을 비교합니다. [159 자].


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Dreamweaver Mac版
시각적 웹 개발 도구

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경
