


Bagaimana untuk Memilih Baris Rawak dengan Cekap daripada Jadual PostgreSQL Besar?
Kaedah pemilihan baris rawak PostgreSQL
Kaedah pemilihan baris rawak tradisional tidak cekap dan perlahan apabila berurusan dengan jadual besar yang mengandungi berjuta-juta malah berbilion-bilion rekod. Dua kaedah biasa ialah:
-
Gunakan
random()
untuk menapis:select * from table where random() < 0.001;
-
Gunakan
order by random()
danlimit
:select * from table order by random() limit 1000;
Namun, disebabkan keperluan untuk imbasan jadual penuh atau pengisihan, kaedah ini bukanlah pilihan terbaik untuk jadual dengan bilangan baris yang banyak dan akan menyebabkan kesesakan prestasi.
Kaedah pengoptimuman untuk meja besar
Untuk jenis jadual berikut, pertimbangkan kaedah pengoptimuman berikut, yang jauh lebih pantas:
- Lajur ID berangka dengan jurang kecil atau sederhana (diindeks untuk carian yang lebih pantas)
- Tiada atau operasi tulis minimum semasa pemilihan
Pertanyaan:
WITH params AS ( SELECT 1 AS min_id, -- 可选:自定义最小ID起始值 5100000 AS id_span -- 近似ID范围(最大ID - 最小ID + 缓冲) ) SELECT * FROM ( SELECT DISTINCT 1 + trunc(random() * p.id_span)::integer AS id FROM params p, generate_series(1, 1100) g GROUP BY 1 ) r INNER JOIN big ON r.id = big.id LIMIT 1000;
Cara ia berfungsi:
-
Anggaran julat ID:
- Jika tidak diketahui dengan tepat, tanya jadual untuk menganggarkan minimum, maksimum dan jumlah rentang (maks - min) lajur ID.
-
Penjanaan ID rawak:
- Jana set nombor rawak yang berbeza dalam julat ID anggaran.
-
Penyingkiran lebihan dan pendua:
- Kumpulkan nombor yang dijana untuk mengalih keluar pendua, mengurangkan kemungkinan memilih baris yang hilang atau baris yang sudah dipilih.
-
Gabungan jadual dan sekatan:
- Sertai nombor rawak dengan jadual sebenar menggunakan lajur ID (mesti diindeks). Gabungan cekap ini mendapatkan semula data yang sepadan untuk baris yang dipilih.
- Akhir sekali, gunakan had untuk mendapatkan semula bilangan baris yang diperlukan.
Mengapa ia pantas:
-
Penggunaan indeks minimum:
- Pertanyaan hanya melakukan imbasan indeks pada lajur ID, yang jauh lebih pantas daripada imbasan jadual penuh atau operasi isihan.
-
Penjanaan nombor rawak yang dioptimumkan:
- Nombor rawak yang dijana diedarkan pada julat ID anggaran, meminimumkan kemungkinan baris hilang atau bertindih.
-
Penyingkiran lebihan dan pendua:
- Menghimpunkan nombor yang dijana memastikan bahawa hanya baris yang berbeza dipilih, mengurangkan keperluan untuk penapisan tambahan atau gabungan untuk menghapuskan pendua.
Pilihan lain:
-
CTE rekursif untuk menangani jurang:
- Untuk jadual dengan jurang dalam jujukan ID, tambahkan CTE tambahan untuk mengendalikan jurang ini.
-
Pembungkus fungsi untuk digunakan semula:
- Tentukan fungsi yang mengambil peratusan had dan jurang sebagai parameter, membolehkan konfigurasi mudah dan digunakan semula dengan jadual yang berbeza.
-
Fungsi universal untuk mana-mana jadual:
- Buat fungsi generik yang menerima sebarang jadual dengan lajur integer sebagai parameter.
-
Realisasikan paparan untuk kelajuan:
- Pertimbangkan untuk mencipta paparan terwujud berdasarkan pertanyaan yang dioptimumkan untuk mendapatkan semula (kuasi) baris yang dipilih secara rawak dengan lebih pantas.
-
TABLE SAMPLE
dalam PostgreSQL 9.5:- Manfaatkan ciri "
TABLE SAMPLE SYSTEM
" PostgreSQL untuk melaksanakan kaedah pensampelan baris yang lebih pantas tetapi kurang rawak, memastikan bilangan baris yang tepat dikembalikan. Walau bagaimanapun, perlu diingat bahawa sampel mungkin tidak rawak sepenuhnya disebabkan oleh kesan pengelompokan.
- Manfaatkan ciri "
Atas ialah kandungan terperinci Bagaimana untuk Memilih Baris Rawak dengan Cekap daripada Jadual PostgreSQL Besar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Dalam pengoptimuman pangkalan data, strategi pengindeksan hendaklah dipilih mengikut keperluan pertanyaan: 1. Apabila pertanyaan melibatkan pelbagai lajur dan urutan syarat ditetapkan, gunakan indeks komposit; 2. Apabila pertanyaan melibatkan pelbagai lajur tetapi urutan syarat tidak ditetapkan, gunakan pelbagai indeks lajur tunggal. Indeks komposit sesuai untuk mengoptimumkan pertanyaan berbilang lajur, manakala indeks lajur tunggal sesuai untuk pertanyaan tunggal lajur.

Untuk mengoptimumkan pertanyaan perlahan MySQL, SlowQuerylog dan Performance_Schema perlu digunakan: 1. Dayakan SlowQueryLog dan tetapkan ambang untuk merakam pertanyaan perlahan; 2. Gunakan Performance_Schema untuk menganalisis butiran pelaksanaan pertanyaan, cari kesesakan prestasi dan mengoptimumkan.

MySQL dan SQL adalah kemahiran penting untuk pemaju. 1.MYSQL adalah sistem pengurusan pangkalan data sumber terbuka, dan SQL adalah bahasa standard yang digunakan untuk mengurus dan mengendalikan pangkalan data. 2.MYSQL menyokong pelbagai enjin penyimpanan melalui penyimpanan data yang cekap dan fungsi pengambilan semula, dan SQL melengkapkan operasi data yang kompleks melalui pernyataan mudah. 3. Contoh penggunaan termasuk pertanyaan asas dan pertanyaan lanjutan, seperti penapisan dan penyortiran mengikut keadaan. 4. Kesilapan umum termasuk kesilapan sintaks dan isu -isu prestasi, yang boleh dioptimumkan dengan memeriksa penyataan SQL dan menggunakan perintah menjelaskan. 5. Teknik pengoptimuman prestasi termasuk menggunakan indeks, mengelakkan pengimbasan jadual penuh, mengoptimumkan operasi menyertai dan meningkatkan kebolehbacaan kod.

MySQL Asynchronous Master-Slave Replikasi membolehkan penyegerakan data melalui binlog, meningkatkan prestasi baca dan ketersediaan yang tinggi. 1) Rekod pelayan induk berubah kepada binlog; 2) Pelayan hamba membaca binlog melalui benang I/O; 3) Server SQL Thread menggunakan binlog untuk menyegerakkan data.

MySQL adalah sistem pengurusan pangkalan data sumber terbuka. 1) Buat Pangkalan Data dan Jadual: Gunakan perintah Createdatabase dan Createtable. 2) Operasi Asas: Masukkan, Kemas kini, Padam dan Pilih. 3) Operasi lanjutan: Sertai, subquery dan pemprosesan transaksi. 4) Kemahiran Debugging: Semak sintaks, jenis data dan keizinan. 5) Cadangan Pengoptimuman: Gunakan indeks, elakkan pilih* dan gunakan transaksi.

Pemasangan dan operasi asas MySQL termasuk: 1. Muat turun dan pasang MySQL, tetapkan kata laluan pengguna root; 2. Gunakan arahan SQL untuk membuat pangkalan data dan jadual, seperti CreateTatabase dan Createtable; 3. Melaksanakan operasi CRUD, gunakan memasukkan, pilih, kemas kini, padamkan arahan; 4. Buat indeks dan prosedur tersimpan untuk mengoptimumkan prestasi dan melaksanakan logik kompleks. Dengan langkah -langkah ini, anda boleh membina dan mengurus pangkalan data MySQL dari awal.

Innodbbufferpool meningkatkan prestasi pangkalan data MySQL dengan memuatkan data dan halaman indeks ke dalam ingatan. 1) Halaman data dimuatkan ke dalam bufferpool untuk mengurangkan cakera I/O. 2) Halaman kotor ditandakan dan disegarkan ke cakera secara teratur. 3) Pengurusan Data Pengurusan Algoritma LRU Penghapusan. 4) Mekanisme pembacaan memuatkan halaman data yang mungkin terlebih dahulu.

MySQL sesuai untuk pemula kerana mudah dipasang, kuat dan mudah untuk menguruskan data. 1. Pemasangan dan konfigurasi mudah, sesuai untuk pelbagai sistem operasi. 2. Menyokong operasi asas seperti membuat pangkalan data dan jadual, memasukkan, menanyakan, mengemas kini dan memadam data. 3. Menyediakan fungsi lanjutan seperti menyertai operasi dan subqueries. 4. Prestasi boleh ditingkatkan melalui pengindeksan, pengoptimuman pertanyaan dan pembahagian jadual. 5. Sokongan sokongan, pemulihan dan langkah keselamatan untuk memastikan keselamatan data dan konsistensi.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

MinGW - GNU Minimalis untuk Windows
Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

PhpStorm versi Mac
Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

SublimeText3 versi Inggeris
Disyorkan: Versi Win, menyokong gesaan kod!

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa