Memasukkan ke dalam jadual MySQL yang besar tanpa kunci utama auto-increment adalah sangat perlahan

Question

Saya baru-baru ini melihat peningkatan ketara dalam perbezaan masa yang diperlukan untuk melengkapkan pernyataan INSERT yang mudah. Walaupun kenyataan ini mengambil masa kira-kira 11 milisaat secara purata, ia kadangkala boleh mengambil masa 10-30 saat, malah saya perasan ia mengambil masa lebih daripada 5 minit untuk dilaksanakan. Versi MySQL ialah 8.0.24, berjalan pada WindowsServer2016. Setahu saya, sumber pelayan tidak pernah terlebih beban. Pelayan mempunyai overhed CPU yang mencukupi dan 32GB RAM diperuntukkan kepadanya. Ini ialah jadual yang saya gunakan: CREATETABLE`saved_segment

P粉022140576 · Answer

Saya akan keluar sendiri dengan jawapan ini.

Hipotesis

innodb_buffer_pool_size kurang sedikit daripada 20MB, dan
1K pilihan sesaat tiba di bahagian rawak jadual, kemudian

Sistem telah menjadi terikat I/O sejak kebelakangan ini, kerana blok "seterusnya" yang diperlukan untuk Pilih seterusnya semakin kerap tidak dicache dalam buffer_pool.

Penyelesaian mudah adalah untuk mendapatkan lebih banyak RAM dan meningkatkan tetapan boleh melaras ini. Tetapi jadual hanya akan berkembang ke had seterusnya yang anda beli.

Sebaliknya, berikut adalah beberapa penyelesaian separa.

Jika nombor tidak terlalu besar, dua lajur pertama mungkin INT UNSIGNED（4 个字节而不是 8），甚至可能是 MEDIUMINT UNSIGNED（3 个字节））。注意 ALTER TABLE mengunci meja untuk masa yang lama.
Masa mula dan tamat ini kelihatan seperti cap masa dengan pecahan saat dan sentiasa ".000". DATETIME 和 TIMESTAMP Mengambil 5 bait (bukannya 8 bait).
Contoh anda menunjukkan masa berlalu sebanyak 0. Jika (permulaan akhir) biasanya sangat kecil, menyimpan masa berlalu dan bukannya masa tamat akan mengecilkan lagi data. (Tetapi menggunakan masa akhir boleh membuat keadaan mengelirukan).
Data contoh yang anda berikan kelihatan "berterusan". Ini adalah sama cekapnya dengan kenaikan automatik. Adakah ini norma? Jika tidak, INSERT mungkin sebahagian daripada I/O thrashing.
Anda mencadangkan menambah kecerdasan buatan serta indeks sekunder, yang menggandakan kerja memasukkan, jadi saya tidak mengesyorkannya.

Lagi

Ya, begitulah keadaannya.

Menggunakannya sebagai permulaan INDEX，或者更好的是，作为 PRIMARY KEY akan memberi anda bantuan terbaik dengan kedua-dua pertanyaan anda:

(recording_id, index)

Balas:

SELECT  TRUE
FROM    saved_segment
WHERE   recording_id = ? AND `index` = ?

Jika ia digunakan untuk mengawal beberapa SQL lain, pertimbangkan untuk menambahkannya pada SQL yang lain:

... EXISTS ( SELECT 1
        FROM    saved_segment
        WHERE   recording_id = ? AND `index` = ? ) ...

Pertanyaan ini (dalam mana-mana bentuk) memerlukan kandungan yang anda sudah ada

PRIMARY KEY(recording_id, index)

Perlu pertanyaan anda yang lain

INDEX(recording_id, start_filetime)

Jadi, tambah indeks, atau ...

Lebih baik... Gabungan ini lebih baik untuk kedua-duanya : SELECT

PRIMARY KEY(recording_id, start_filetime, index).
INDEX(recording_id, index)

Dengan gabungan ini,

boleh meningkatkan prestasi dengan mengurangkan bilangan blok cakera yang diperlukan untuk pertanyaan sedemikian. Ini mengurangkan "belasah" dalam buffer_pool, dengan itu mengurangkan keperluan untuk meningkatkan RAM.

Memasukkan ke dalam jadual MySQL yang besar tanpa kunci utama auto-increment adalah sangat perlahan

membalas semua(1)saya akan balas