찾다
데이터 베이스MySQL 튜토리얼MySQL에서 무작위 추출을 구현하는 방법

1. 소개

이제 단어 목록에서 한 번에 세 단어를 무작위로 선택해야 하는 요구 사항이 있습니다.

이 테이블의 테이블 생성문은 다음과 같습니다.

mysql> Create table 'words'(
    'id' int(11) not null auto_increment;
    'word' varchar(64) default null;
    primary key ('id')
) ENGINE=InnoDB;

그런 다음 10,000행의 데이터를 삽입합니다. 다음으로 무작위로 3개의 단어를 선택하는 방법을 살펴보겠습니다.

2. 메모리 임시 테이블

우선, 우리는 일반적으로 이 논리를 구현하기 위해 rand()로 order를 사용하는 것을 생각합니다.

mysql> select word from words order by rand() limit 3;

이 문장은 매우 간단하지만 실행 과정은 더 복잡합니다. explain을 사용하여 명령문의 실행을 확인합니다. Extra 필드에서 temporary를 사용하면 임시 테이블을 사용해야 함을 나타내고, filesort를 사용하면 정렬이 필요함을 나타냅니다. 즉, 정렬 작업이 필요합니다.

MySQL에서 무작위 추출을 구현하는 방법InnoDB 테이블

의 경우 전체 필드 정렬을 수행하면 디스크 액세스가 줄어들 수 있으므로 선호됩니다.

메모리 테이블의 경우 테이블 반환 프로세스는 단순히 메모리에 직접 액세스하여 데이터 행의 위치를 ​​기반으로 데이터를 가져오므로 다중 디스크 액세스가 전혀 발생하지 않습니다

. 따라서 현재 MySQL은 rowid 정렬에 우선순위를 부여합니다. MySQL에서 무작위 추출을 구현하는 방법

이 명령문의 실행 과정을 정리해 보겠습니다.

MySQL에서 무작위 추출을 구현하는 방법

임시 테이블을 만듭니다. 이 테이블은 테이블에 두 개의 필드가 표시되어 있습니다. R과 마찬가지로 두 번째 필드는 W로 표시된 varchar(64) 유형입니다. 그리고 이 테이블에는 인덱스가 없습니다.

  • 단어 테이블에서 기본 키 순서대로 모든 단어를 추출합니다. 각 단어에 대해 rand() 함수를 호출하여 0보다 크고 1보다 작은 임의의 십진수를 무작위로 생성하고 임시 테이블의 R 및 W 필드에 각각 임의의 십진수와 단어를 저장합니다.

  • 다음 단계는 R
  • sort_buffer를 초기화하는 것입니다. sort_buffer에는 double 유형과 정수 필드가 포함됩니다.
  • 임시 메모리 테이블에서 R 값과 위치 정보를 한 줄씩 꺼내서 sort_buffer의 두 필드에 각각 저장합니다.
  • sort_buffer는 R 값에 따라 정렬됩니다.
  • 정렬이 완료되면 처음 3개 결과의 위치 정보를 꺼내고, 메모리 임시 테이블에서 해당 단어를 꺼내어 다시 테이블로 반환합니다. 고객.
  • 프로세스 다이어그램은 다음과 같습니다.

위에서 언급한 위치 정보는 실제로 앞서 언급한 rowid인 row의 위치입니다.

MySQL에서 무작위 추출을 구현하는 방법InnoDB 엔진의 경우 기본 키가 있거나 없는 테이블에 대해 두 가지 처리 방법이 있습니다.

기본 키가 있는

InnoDB 테이블

의 경우 이 rowid는 기본 키 ID입니다

  • 기본 키가 없는 경우 InnoDB 테이블의 경우 이 rowid는 시스템에 의해 생성되며 다른 행을 식별하는 데 사용됩니다.

  • 따라서

    order by randn()은 메모리 임시 테이블을 사용하고, 메모리 임시 테이블의 정렬 방법은 rowid 정렬 방법을 사용합니다.

    3. 디스크 임시 테이블

모든 임시 테이블이 메모리 임시 테이블은 아닙니다. tmp_table_size 구성은 메모리 임시 테이블의 크기를 제한합니다. 이 크기를 초과하면 디스크 임시 테이블이 사용됩니다. InnoDB 엔진은 기본적으로 디스크 임시 테이블을 사용합니다

.

4. 우선순위 대기열 정렬 알고리즘

MySQL 5.6 이후에는 우선순위 대기열 정렬 알고리즘이 도입되었습니다. 이 알고리즘은 임시 파일을 사용할 필요가 없습니다. 원래 병합 정렬 알고리즘에서는 임시 파일을 사용해야 합니다.

병합 알고리즘을 사용하면 실제로는 상위 3개만 구하면 되는데, 병합 정렬이 부족하면 이미 모든 것이 정돈되어 있어 자원 낭비가 발생하기 때문입니다.

우선순위 큐 정렬 알고리즘은 상위 3개만 가져올 수 있으며 실행 과정은 다음과 같습니다.

이 10,000개(R, rowid)를 정렬하려면 먼저 처음 3개 행을 가져와서 힙을 구성하고, 가장 큰 값을 힙의 맨 위에 배치합니다.

다음 행(R’, rowid’)을 꺼내서 현재 힙에서 가장 큰 R과 비교합니다. 힙에서 (R, rowid)를 제거하고 (R’,rowid’)로 바꿉니다.
  • 위의 과정을 반복하세요.
  • 과정은 아래 그림과 같습니다.
  • 하지만 제한 개수가 상대적으로 클 경우 힙을 유지하기가 더 어려우므로 병합 정렬 알고리즘을 사용하게 됩니다.

위 내용은 MySQL에서 무작위 추출을 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
MySQL : Blob 및 기타없는 SQL 스토리지, 차이점은 무엇입니까?MySQL : Blob 및 기타없는 SQL 스토리지, 차이점은 무엇입니까?May 13, 2025 am 12:14 AM

mysql'sblobissuilableforstoringbinarydatawithinareldatabase, whilenosqloptionslikemongodb, redis, and cassandraofferflexible, scalablesolutionsforunstuctureddata.blobissimplerbutcanslowwownperformance를 사용하는 것들보업 betterscal randaysand

MySQL 추가 사용자 : 구문, 옵션 및 보안 모범 사례MySQL 추가 사용자 : 구문, 옵션 및 보안 모범 사례May 13, 2025 am 12:12 AM

TOADDAUSERINMYSQL, 사용 : CreateUser'UserName '@'host'IdentifiedBy'Password '; 여기서'showTodoitseciRely : 1) ChoosetheHostCareLyTocon trolaccess.2) setResourcelimitswithOptionslikemax_queries_per_hour.3) Usestrong, iriquepasswords.4) enforcessl/tlsconnectionswith

MySQL : 문자열 데이터 유형을 피하는 방법 일반적인 실수?MySQL : 문자열 데이터 유형을 피하는 방법 일반적인 실수?May 13, 2025 am 12:09 AM

toavoidcommonmistakeswithstringdatatypesinmysql, stroundStringTypenuances, chooseTherightType, andManageEncodingAndCollationSettingSefectively.1) usecharforfixed-lengthstrings, varcharvariable-length, andtext/blobforlargerdata.2) setcarcatter

MySQL : 문자열 데이터 유형 및 열거?MySQL : 문자열 데이터 유형 및 열거?May 13, 2025 am 12:05 AM

mysqloffersechar, varchar, text, anddenumforstringdata.usecharforfixed-lengthstrings, varcharerforvariable 길이, 텍스트 forlarger 텍스트, andenumforenforcingdataantegritystofvalues.

MySQL Blob : Blobs 요청을 최적화하는 방법MySQL Blob : Blobs 요청을 최적화하는 방법May 13, 2025 am 12:03 AM

mysqlblob 요청 최적화는 다음 전략을 통해 수행 할 수 있습니다. 1. Blob 쿼리의 빈도를 줄이거나 독립적 인 요청을 사용하거나 지연로드를 사용하십시오. 2. 적절한 Blob 유형 (예 : TinyBlob)을 선택하십시오. 3. Blob 데이터를 별도의 테이블로 분리하십시오. 4. 응용 프로그램 계층에서 블로브 데이터를 압축합니다. 5. Blob Metadata를 색인하십시오. 이러한 방법은 실제 애플리케이션에서 모니터링, 캐싱 및 데이터 샤딩을 결합하여 성능을 효과적으로 향상시킬 수 있습니다.

MySQL에 사용자 추가 : 완전한 튜토리얼MySQL에 사용자 추가 : 완전한 튜토리얼May 12, 2025 am 12:14 AM

MySQL 사용자를 추가하는 방법을 마스터하는 것은 데이터베이스 관리자 및 개발자가 데이터베이스의 보안 및 액세스 제어를 보장하기 때문에 데이터베이스 관리자 및 개발자에게 중요합니다. 1) CreateUser 명령을 사용하여 새 사용자를 만듭니다. 2) 보조금 명령을 통해 권한 할당, 3) FlushPrivileges를 사용하여 권한이 적용되도록하십시오.

MySQL 문자열 데이터 유형 마스터 링 : Varchar vs. Text vs. CharMySQL 문자열 데이터 유형 마스터 링 : Varchar vs. Text vs. CharMay 12, 2025 am 12:12 AM

ChooseCharfixed-lengthdata, varcharforvariable-lengthdata, andtextforlargetextfields.1) charisefficientsconsentent-lengthdatalikecodes.2) varcharsuitsvariable-lengthdatalikeNames, 밸런싱 플렉스 및 성능

MySQL : 문자열 데이터 유형 및 인덱싱 : 모범 사례MySQL : 문자열 데이터 유형 및 인덱싱 : 모범 사례May 12, 2025 am 12:11 AM

MySQL에서 문자열 데이터 유형 및 인덱스를 처리하기위한 모범 사례는 다음과 같습니다. 1) 고정 길이의 Char, 가변 길이의 Varchar 및 큰 텍스트의 텍스트와 같은 적절한 문자열 유형 선택; 2) 인덱싱에 신중하고, 과도한 인덱싱을 피하고, 공통 쿼리에 대한 인덱스를 만듭니다. 3) 접두사 인덱스 및 전체 텍스트 인덱스를 사용하여 긴 문자열 검색을 최적화합니다. 4) 인덱스를 작고 효율적으로 유지하기 위해 인덱스를 정기적으로 모니터링하고 최적화합니다. 이러한 방법을 통해 읽기 및 쓰기 성능의 균형을 맞추고 데이터베이스 효율성을 향상시킬 수 있습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구