Rumah >pangkalan data >tutorial mysql >Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?

Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?

Mary-Kate Olsen
Mary-Kate Olsenasal
2025-01-19 02:43:10185semak imbas

How to Delete Duplicate Rows from a PostgreSQL Table While Preserving a Unique Column?

Alih keluar baris pendua daripada jadual kecil dengan lajur unik

Dalam pangkalan data PostgreSQL, menghapuskan baris pendua boleh meningkatkan integriti data dan mengoptimumkan prestasi. Katakan anda mempunyai jadual yang mengandungi baris tanpa kekangan dan data pendua, khususnya dalam lajur tertentu yang dipanggil "kunci". Matlamatnya adalah untuk mengalih keluar pendua dan menyimpan satu contoh bagi setiap nilai "kunci" unik.

Penyelesaian arahan SQL tunggal

Untuk melakukan ini dengan satu arahan SQL, anda boleh menggunakan langkah berikut:

1 Kenal pasti kejadian berulang pertama: Pertama, kita perlu mengenal pasti kejadian pertama setiap baris berulang. Maklumat ini penting untuk mengekalkan satu salinan data.

<code class="language-sql">SELECT MIN(ctid) AS ctid, key
FROM dups
GROUP BY key HAVING COUNT(*) > 1;</code>

2. Padamkan kejadian bukan pertama: Setelah kejadian pertama dikenal pasti, kami boleh mengalih keluar semua pendua berikutnya berdasarkan nilai "ctid" mereka. Lajur "ctid" mewakili lokasi fizikal baris dalam jadual.

<code class="language-sql">DELETE FROM dups a USING (
    SELECT MIN(ctid) AS ctid, key
    FROM dups
    GROUP BY key HAVING COUNT(*) > 1
) b
WHERE a.key = b.key
AND a.ctid <> b.ctid;</code>

Pertimbangkan susunan talian

Walaupun kaedah ini berkesan mengalih keluar pendua, ia tidak memastikan baris mana yang dikekalkan sekiranya berlaku berbilang kejadian. Jika terdapat kriteria khusus untuk memilih baris untuk disimpan, ia harus dimasukkan ke dalam pertanyaan.

Contoh:

Untuk pemahaman yang lebih baik, pertimbangkan contoh berikut:

<code class="language-sql">CREATE TABLE people (
    name    VARCHAR(50) NOT NULL,
    surname VARCHAR(50) NOT NULL,
    age     INTEGER NOT NULL
);

INSERT INTO people (name, surname, age) VALUES
    ('A.', 'Tom', 30),
    ('A.', 'Tom', 10),
    ('B.', 'Tom', 20),
    ('B', 'Chris', 20);

-- 显示重复项的第一次出现:
SELECT MIN(ctid) AS ctid, name, surname
FROM people
GROUP BY (name, surname) HAVING COUNT(*) > 1;

-- 删除重复项的非第一次出现:
DELETE FROM people a USING (
    SELECT MIN(ctid) AS ctid, name, surname
    FROM people
    GROUP BY (name, surname) HAVING COUNT(*) > 1
) b
WHERE a.name = b.name
AND a.surname = b.surname
AND a.ctid <> b.ctid;

SELECT * FROM people;</code>

Jadual contoh ini mengandungi data peribadi yang berpotensi menjadi pendua. Selepas melaksanakan pertanyaan kedua, pendua akan dialih keluar dan hanya nama pertama dan nama keluarga yang unik kekal dalam jadual.

Atas ialah kandungan terperinci Bagaimana untuk Memadam Baris Pendua dari Jadual PostgreSQL Semasa Memelihara Lajur Unik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn