Rumah >pangkalan data >tutorial mysql >Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

PHPz
PHPzke hadapan
2023-06-03 08:25:521788semak imbas

1. Pengenalan

Kini terdapat keperluan untuk memilih tiga perkataan secara rawak pada satu masa daripada senarai perkataan.

Pernyataan penciptaan jadual jadual ini adalah seperti berikut:

mysql> Create table 'words'(
    'id' int(11) not null auto_increment;
    'word' varchar(64) default null;
    primary key ('id')
) ENGINE=InnoDB;

Kemudian kami memasukkan 10,000 baris data ke dalamnya. Seterusnya mari kita lihat bagaimana untuk memilih 3 perkataan secara rawak daripadanya.

2. Memori sementara jadual

Pertama sekali, kita biasanya berfikir menggunakan perintah oleh rand() untuk melaksanakan logik ini:

mysql> select word from words order by rand() limit 3;

Walaupun ayat ini sangat mudah, tetapi pelaksanaan Prosesnya lebih rumit. Kami menggunakan explain untuk melihat pelaksanaan pernyataan:

Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

Menggunakan sementara dalam medan Tambahan menunjukkan bahawa jadual sementara perlu digunakan dan Menggunakan filesort menunjukkan bahawa pengisihan diperlukan . Maksudnya, operasi pengisihan diperlukan.

Untuk jadual InnoDB, melaksanakan pengisihan medan penuh boleh mengurangkan akses cakera, jadi ia lebih diutamakan.

Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

Untuk jadual memori, proses pemulangan jadual hanya mengakses memori terus untuk mendapatkan data berdasarkan lokasi baris data, dan tidak menghasilkan berbilang akses cakera sama sekali . Jadi pada masa ini MySQL akan memberi keutamaan kepada pengisihan rowid.

Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

Mari kita selesaikan proses pelaksanaan pernyataan ini:

  • Buat jadual sementara, jadual ini Menggunakan memori enjin , terdapat dua medan dalam jadual Medan pertama adalah jenis berganda, ditandakan sebagai R, dan medan kedua adalah jenis varchar(64), ditandakan sebagai W. Dan jadual ini tidak mempunyai indeks.

  • Daripada perkataan jadual, alih keluar semua perkataan mengikut urutan kunci primer. Untuk setiap perkataan, panggil fungsi rand() untuk menjana nombor perpuluhan rawak yang lebih besar daripada 0 dan kurang daripada 1 secara rawak, dan masing-masing menyimpan nombor perpuluhan rawak dan perkataan dalam medan R dan W jadual sementara.

  • Langkah seterusnya ialah mengisih mengikut medan R

  • Memulakan sort_buffer. sort_buffer termasuk jenis berganda dan medan integer.

  • Dapatkan nilai R dan kedudukan maklumat baris demi baris daripada jadual memori sementara, dan simpannya dalam dua medan sort_buffer masing-masing.

  • sort_buffer diisih mengikut nilai R

  • Selepas pengisihan selesai, keluarkan maklumat lokasi bagi tiga keputusan pertama dan dapatkan semula maklumat yang sepadan daripada jadual ingatan sementara Perkataan itu dikembalikan kepada klien.

Rajah proses adalah seperti berikut:

Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL

Maklumat lokasi yang dinyatakan di atas sebenarnya adalah lokasi baris, iaitu, Inilah rowid yang kami nyatakan sebelum ini.

Untuk enjin InnoDB, terdapat dua kaedah pemprosesan untuk jadual dengan atau tanpa kunci utama:

  • Untuk Jadual InnoDB dengan kunci utama, rowid ini ialah id kunci utama

  • Untuk

    jadual InnoDB tanpa kunci utama, rowid ini dijana oleh sistem dan digunakan untuk mengenal pasti baris yang berbeza .

Oleh itu,

pesanan mengikut randn() menggunakan jadual sementara memori, dan kaedah pengisihan jadual sementara memori menggunakan kaedah isihan rowid .

3. Jadual sementara cakera

Bukan semua jadual sementara ialah jadual sementara memori. Konfigurasi tmp_table_size mengehadkan saiz jadual sementara memori Jika saiz ini melebihi, jadual sementara cakera akan digunakan. Enjin InnoDB menggunakan jadual sementara cakera secara lalai.

4. Algoritma pengisihan barisan keutamaan

Selepas MySQL 5.6, algoritma pengisihan barisan keutamaan

Algoritma ini tidak memerlukan penggunaan fail sementara . Algoritma isihan gabungan asal memerlukan penggunaan fail sementara.

Kerana apabila anda menggunakan algoritma gabungan, anda sebenarnya hanya perlu mendapatkan 3 teratas, tetapi jika anda kehabisan isihan gabungan, semuanya sudah teratur, menyebabkan pembaziran sumber.

Algoritma pengisihan barisan keutamaan hanya boleh mengambil tiga teratas Proses pelaksanaan adalah seperti berikut:

  • Untuk diisih 10,000 (R, rowid) ini, ambil. tiga baris teratas dahulu. Tiga baris dibina menjadi timbunan, dan nilai terbesar diletakkan di bahagian atas timbunan; bandingkannya dengan R terbesar dalam timbunan semasa Jika R&rsquo kurang daripada R, keluarkan (R, rowid) daripada timbunan dan gantikannya dengan (R’, rowid’).

  • Ulang proses di atas.

  • Prosesnya seperti rajah di bawah:

Tetapi apabila bilangan hadnya agak besar, ia lebih sukar untuk mengekalkan timbunan, jadi ia akan Gunakan algoritma isihan gabungan.

Atas ialah kandungan terperinci Bagaimana untuk melaksanakan pengekstrakan rawak dalam MySQL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:yisu.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam