Rumah  >  Artikel  >  pangkalan data  >  Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

王林
王林ke hadapan
2023-06-03 10:49:442061semak imbas

Pangkalan data ujian yang diterbitkan semula adalah seperti berikut:

CREATE TABLE `test_distinct` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  `b` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=latin1;

Data ujian dalam jadual adalah seperti berikut.

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Analisis Masalah

Rakan saya memberi saya empat pernyataan pertanyaan untuk mencari masalah

SELECT COUNT(*) AS cnt FROM test_distinct;
SELECT COUNT(DISTINCT id, a, b) as cnt FROM test_distinct;
SELECT id, a, b, COUNT(*) AS cnt FROM test_distinct GROUP BY id, a, b HAVING cnt > 1;
SELECT 
	l.id AS l_id,
	l.a AS l_a,
	l.b AS l_b,
	r.id AS r_id,
	r.a AS r_a,
	r.b AS r_b
FROM test_distinct l LEFT JOIN test_distinct r
ON l.id = r.id AND l.a = r.a AND l.b = r.b
WHERE r.id is NULL or r.id = 'null';

Hasil pertanyaan adalah seperti berikut:

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Perhatian! ! ! Daripada data ujian, kita boleh meneka dengan cepat di mana masalahnya, tetapi ternyata terdapat lebih daripada 30,000 keping data dalam jadual, dan adalah mustahil untuk melihat data dengan mata kasar.

Terdapat dua titik berlawanan dalam keputusan pertanyaan di atas:

  • Sekeping data kedua tiada selepas statistik penduaan, tetapi keputusan sekeping data ketiga menunjukkan Tiada data yang sama.

  • Menggunakan jadual yang sama untuk melakukan sambungan luar kiri, jadual pemanduan mempunyai data, tetapi jadual dipandu kosong.

Mari lihat soalan kedua dahulu Dokumentasi rasmi mempunyai penjelasan berikut:

  • Apabila menggunakan klausa ON, syarat yang terkandung di dalamnya. Ungkapan adalah sama seperti yang digunakan dalam klausa WHERE. Situasi biasa ialah menggunakan klausa ON untuk menentukan syarat cantuman jadual, dan gunakan klausa WHERE untuk mengehadkan baris yang disertakan dalam set hasil.

  • Jika jadual yang betul tidak mempunyai baris yang sepadan untuk keadaan dalam bahagian ON atau USING LEFT JOIN, maka jadual kanan menggunakan semua lajur yang ditetapkan kepada NULL.

  • Anda tidak boleh menggunakan operator perbandingan aritmetik (seperti =, ) untuk membandingkan NULL.

SELECT NULL = NULL;
SELECT NULL IS NULL;

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Jadi masalah kedua ialah hasil NULL=NULL sentiasa Palsu, yang mengakibatkan dua baris asalnya Hasil data yang sama adalah tidak sama.

Tetapi ini tidak menyelesaikan masalah pertama: mengapa sekeping data hilang selepas penyahduplikasian. Walau bagaimanapun, kita boleh meneka bahawa data yang hilang mungkin berkaitan dengan nilai NULL.

Kami memisahkan kiraan dan operasi berbeza:

SELECT COUNT(*) as cnt FROM (SELECT  DISTINCT id, a, b FROM test_distinct) as tmp;

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Hah? Hasilnya adalah betul, yang bermaksud bahawa pelan pertanyaan yang dijana oleh count(distinct expr) mungkin berbeza daripada apa yang kami bayangkan daripada mengalih keluar pendua terlebih dahulu dan kemudian mengira, gunakan explain untuk menganalisis pelan pertanyaan bagi kedua-dua pernyataan, seperti yang ditunjukkan di bawah: <.>

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Seperti yang anda lihat dari jadual, enjin pelaksanaan mysql secara langsung menggunakan

sebagai pertanyaan Lihat dokumentasi rasmi: count(distinct expr)

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Penyelesaian

Masalah akhirnya dapat dijelaskan. Terdapat dua cara untuk menyelesaikan masalah ini. Yang pertama ialah membuang pendua dahulu dan kemudian mengira seperti yang dinyatakan di atas. Yang kedua boleh menggunakan fungsi

: IFNULL()

SELECT COUNT(DISTINCT id, a, IFNULL(b, &#39;0&#39;)) as cnt FROM test_distinct;

Selain itu, count() boleh. digunakan sebaliknya:

SELECT id, a, b, COUNT(*) FROM test_distinct GROUP BY id, a, b;
SELECT id, a, b, COUNT(b) FROM test_distinct GROUP BY id, a, b;

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql

Titik pengetahuan

  • Anda tidak boleh menggunakan operator perbandingan aritmetik (seperti sebagai =, ) untuk membandingkan nilai nol; >
  • COUNT() mempunyai dua kegunaan berbeza: ia boleh digunakan untuk mengira bilangan nilai dalam lajur, atau ia boleh digunakan untuk mengira bilangan baris. Semasa mengira nilai lajur, nilai lajur dikehendaki tidak kosong (NULL tidak dikira). Apabila lajur atau ungkapan dinyatakan dalam kurungan bagi fungsi COUNT(), fungsi mengira bilangan hasil yang mempunyai nilai dalam ungkapan. Satu lagi fungsi COUNT() ialah mengira bilangan baris dalam set hasil. Apabila MySQL mengesahkan bahawa nilai ungkapan dalam kurungan tidak boleh kosong, ia sebenarnya mengira bilangan baris. Perkara yang paling mudah ialah apabila kami menggunakan COUNT(). Dalam kes ini, kad bebas tidak berkembang ke semua lajur seperti yang kami jangkakan, ia akan mengabaikan semua lajur dan terus mengira semua baris - "MySQL Berprestasi Tinggi";

  • Dalam InnoDB, SELECT COUNT(*) dan SELECT COUNT(1) diproses dengan cara yang sama, dan tiada perbezaan prestasi.

Atas ialah kandungan terperinci Bagaimana untuk menyelesaikan masalah mengira berbilang lajur yang berbeza dalam mysql. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:yisu.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam