PostgreSQL과 같은 대규모 데이터베이스에서 행을 무작위로 선택하는 것은 성능 집약적인 작업일 수 있습니다. 이 기사에서는 이 목표를 효율적으로 달성하는 두 가지 일반적인 방법을 살펴보고 각 방법의 장점과 단점을 논의합니다.
방법 1: 임의의 값으로 필터링
select * from table where random() < 0.01;
이 방법은 행을 무작위로 정렬한 다음 임계값을 기준으로 필터링합니다. 그러나 전체 테이블 스캔이 필요하며 대규모 데이터 세트의 경우 속도가 느려질 수 있습니다.
방법 2: 임의의 값으로 정렬하고 결과를 제한합니다
select * from table order by random() limit 1000;
이 방법은 행을 무작위로 정렬하고 상위 n개 행을 선택합니다. 첫 번째 방법보다 성능은 좋지만 제한 사항이 있습니다. 행 그룹에 행이 너무 많으면 임의의 하위 집합을 선택하지 못할 수 있습니다.
대규모 데이터 세트에 대한 최적화 솔루션
행 수가 많은 테이블(예: 5억 행)의 경우 다음 접근 방식이 최적화된 솔루션을 제공합니다.
WITH params AS ( SELECT 1 AS min_id, -- 最小ID(小于等于当前最小ID) 5100000 AS id_span -- 四舍五入。(max_id - min_id + buffer) ) SELECT * FROM ( SELECT p.min_id + trunc(random() * p.id_span)::integer AS id FROM params p , generate_series(1, 1100) g -- 1000 + buffer GROUP BY 1 -- 去除重复项 ) r JOIN big USING (id) LIMIT 1000; -- 去除多余项
이 쿼리는 효율적인 검색을 위해 ID 열의 인덱스를 활용합니다. ID 공간 내에서 일련의 난수를 생성하여 ID가 고유한지 확인하고 데이터를 기본 테이블과 조인하여 필요한 행 수를 선택합니다.
기타 고려사항
경계 쿼리:
난수 생성 시 큰 버퍼가 필요하지 않도록 하려면 테이블 ID 열에 간격이 상대적으로 적어야 합니다.
구체화된 보기:
무작위 데이터에 반복적으로 액세스해야 하는 경우 구체화된 뷰를 생성하여 성능을 향상시키는 것을 고려하십시오.
PostgreSQL 9.5용 테이블 샘플 시스템:
PostgreSQL 9.5에 도입된 이 최적화 기술을 사용하면 지정된 비율의 행을 빠르게 샘플링할 수 있습니다.
위 내용은 대규모 PostgreSQL 테이블에서 무작위 행을 효율적으로 선택하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사는 MySQL의 Alter Table 문을 사용하여 열 추가/드롭 테이블/열 변경 및 열 데이터 유형 변경을 포함하여 테이블을 수정하는 것에 대해 설명합니다.

기사는 인증서 생성 및 확인을 포함하여 MySQL에 대한 SSL/TLS 암호화 구성에 대해 설명합니다. 주요 문제는 자체 서명 인증서의 보안 영향을 사용하는 것입니다. [문자 수 : 159]

기사는 MySQL에서 파티셔닝, 샤딩, 인덱싱 및 쿼리 최적화를 포함하여 대규모 데이터 세트를 처리하기위한 전략에 대해 설명합니다.

기사는 MySQL Workbench 및 Phpmyadmin과 같은 인기있는 MySQL GUI 도구에 대해 논의하여 초보자 및 고급 사용자를위한 기능과 적합성을 비교합니다. [159 자].

이 기사에서는 Drop Table 문을 사용하여 MySQL에서 테이블을 떨어 뜨리는 것에 대해 설명하여 예방 조치와 위험을 강조합니다. 백업 없이는 행동이 돌이킬 수 없으며 복구 방법 및 잠재적 생산 환경 위험을 상세하게합니다.

기사는 외국 열쇠를 사용하여 데이터베이스의 관계를 나타내고 모범 사례, 데이터 무결성 및 피할 수있는 일반적인 함정에 중점을 둡니다.

이 기사에서는 PostgreSQL, MySQL 및 MongoDB와 같은 다양한 데이터베이스에서 JSON 열에서 인덱스를 작성하여 쿼리 성능을 향상시킵니다. 특정 JSON 경로를 인덱싱하는 구문 및 이점을 설명하고 지원되는 데이터베이스 시스템을 나열합니다.

기사는 준비된 명령문, 입력 검증 및 강력한 암호 정책을 사용하여 SQL 주입 및 무차별 적 공격에 대한 MySQL 보안에 대해 논의합니다 (159 자)


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

WebStorm Mac 버전
유용한 JavaScript 개발 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

드림위버 CS6
시각적 웹 개발 도구

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

뜨거운 주제



