Die reproduzierte Testdatenbank lautet wie folgt:
CREATE TABLE `test_distinct` ( `id` int(11) NOT NULL AUTO_INCREMENT, `a` varchar(50) CHARACTER SET utf8 DEFAULT NULL, `b` varchar(50) CHARACTER SET utf8 DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=latin1;
Die Testdaten in der Tabelle lauten wie folgt. Jetzt müssen wir die Anzahl der Spalten nach der Deduplizierung dieser drei Spalten zählen.
Problemanalyse
Mein Freund gab mir vier Abfrageanweisungen, um das Problem zu lokalisieren
SELECT COUNT(*) AS cnt FROM test_distinct; SELECT COUNT(DISTINCT id, a, b) as cnt FROM test_distinct; SELECT id, a, b, COUNT(*) AS cnt FROM test_distinct GROUP BY id, a, b HAVING cnt > 1; SELECT l.id AS l_id, l.a AS l_a, l.b AS l_b, r.id AS r_id, r.a AS r_a, r.b AS r_b FROM test_distinct l LEFT JOIN test_distinct r ON l.id = r.id AND l.a = r.a AND l.b = r.b WHERE r.id is NULL or r.id = 'null';#🎜 🎜# Die Abfrageergebnisse lauten wie folgt:
# 🎜🎜 #
Achtung! ! ! Anhand der Testdaten können wir schnell erraten, wo das Problem liegt, aber es stellt sich heraus, dass die Tabelle mehr als 30.000 Daten enthält und es unmöglich ist, die Daten mit bloßem Auge zu sehen.
Es gibt zwei kontraintuitive Punkte in den obigen Abfrageergebnissen:
- Das zweite Datenelement fehlt nach der Deduplizierungsstatistik, aber das zweite Ein Datenelement fehlt. Die Ergebnisse der drei Datenelemente zeigen, dass sie nicht über dieselben Daten verfügen.
- Wenn Sie dieselbe Tabelle verwenden, um einen linken äußeren Join durchzuführen, enthält die treibende Tabelle Daten, aber die getriebene Tabelle ist leer.
- Schauen wir uns zuerst die zweite Frage an:
- Bei der Verwendung ON-Unterklausel enthält sie dieselben bedingten Ausdrücke, die in der WHERE-Klausel verwendet werden. Eine häufige Situation besteht darin, die ON-Klausel zu verwenden, um die Join-Bedingungen der Tabelle anzugeben, und die WHERE-Klausel zu verwenden, um die im Ergebnissatz enthaltenen Zeilen zu begrenzen.
- Wenn es in der rechten Tabelle keine passende Zeile für die Bedingung im ON- oder USING-Teil des LEFT JOIN gibt, verwendet die rechte Tabelle alle auf NULL gesetzten Spalten.
- Sie können keine arithmetischen Vergleichsoperatoren (wie =, ) verwenden, um NULL zu vergleichen. Das zweite Problem liegt also im Ergebnis NULL=NULL Es ist immer Falsch, was dazu führt, dass zwei Datenzeilen ursprünglich gleich, aber nicht gleich sind.
Aber das löst nicht das erste Problem: Warum ein Datenelement nach der Deduplizierung verschwunden ist. Wir können jedoch vermuten, dass die fehlenden Daten wahrscheinlich mit dem NULL-Wert zusammenhängen.
Wir trennen die beiden Operationen „Zählen“ und „Unterscheiden“:
SELECT NULL = NULL; SELECT NULL IS NULL;
Huh? Das Ergebnis ist korrekt, was bedeutet, dass der von count(distinct expr)
generierte Abfrageplan möglicherweise nicht von dem abweicht, was wir uns vorgestellt haben. Es werden keine Duplikate entfernt und dann wird der Abfrageplan mit EXPLAIN analysiert der beiden Aussagen. , wie unten gezeigt:


count(distinct expr )
als Abfrage, offizielles Dokument anzeigen:

Lösung
Das Problem wurde endlich geklärt. Es gibt zwei Möglichkeiten, dieses Problem zu lösen. Die erste besteht darin, zuerst Duplikate zu entfernen und dann wie oben erwähnt zu zählen. Die zweite besteht darin, die Funktion IFNULL()
zu verwenden: count(distinct expr)
生成的查询计划可能和我们想象的不一样,并不是先去重再统计,使用explain分析一下两条语句的查询计划,如下所示:
从表中可以看到,mysql执行引擎直接将count(distinct expr)
作为一个查询,查看官方文档:
解决办法
至此问题才终于弄清楚了。解决这个问题的办法有两种,第一种就是上述的先去重后统计,第二种可以利用IFNULL()
SELECT COUNT(*) as cnt FROM (SELECT DISTINCT id, a, b FROM test_distinct) as tmp;Eine weitere Ergänzung: Verwenden Sie count():
SELECT COUNT(DISTINCT id, a, IFNULL(b, '0')) as cnt FROM test_distinct;
#🎜🎜 #
- Sie können keine arithmetischen Vergleichsoperatoren (wie =, ) verwenden, um Nullwerte zu vergleichen; (distinct expr) gibt die Anzahl der eindeutigen und nicht leeren Zeilen in der expr-Spalte zurück;
COUNT() hat zwei unterschiedliche Verwendungszwecke: Es kann verwendet werden, um die Anzahl der Werte in einer Spalte zu zählen, oder es kann verwendet werden, um die Anzahl der Zeilen zu zählen. Beim Zählen von Spaltenwerten muss der Spaltenwert nicht leer sein (NULL wird nicht gezählt). Wenn eine Spalte oder ein Ausdruck in Klammern der Funktion COUNT() angegeben wird, zählt die Funktion die Anzahl der Ergebnisse, die einen Wert im Ausdruck haben. Eine weitere Funktion von COUNT() besteht darin, die Anzahl der Zeilen in der Ergebnismenge zu zählen. Wenn MySQL bestätigt, dass der Ausdruckswert in den Klammern nicht leer sein darf, zählt es tatsächlich die Anzahl der Zeilen. Am einfachsten ist es, wenn wir COUNT() verwenden. In diesem Fall wird der Platzhalter nicht auf alle Spalten erweitert, sondern alle Zeilen werden direkt gezählt – „Hochleistungs-MySQL“
In InnoDB werden SELECT COUNT(*) und SELECT COUNT(1) auf die gleiche Weise verarbeitet und es gibt keinen Leistungsunterschied.
Das obige ist der detaillierte Inhalt vonSo lösen Sie das Problem der Anzahl verschiedener Spalten in MySQL. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

本篇文章给大家带来了关于mysql的相关知识,其中主要介绍了关于架构原理的相关内容,MySQL Server架构自顶向下大致可以分网络连接层、服务层、存储引擎层和系统文件层,下面一起来看一下,希望对大家有帮助。

在mysql中,可以利用char()和REPLACE()函数来替换换行符;REPLACE()函数可以用新字符串替换列中的换行符,而换行符可使用“char(13)”来表示,语法为“replace(字段名,char(13),'新字符串') ”。

mysql的msi与zip版本的区别:1、zip包含的安装程序是一种主动安装,而msi包含的是被installer所用的安装文件以提交请求的方式安装;2、zip是一种数据压缩和文档存储的文件格式,msi是微软格式的安装包。

方法:1、利用right函数,语法为“update 表名 set 指定字段 = right(指定字段, length(指定字段)-1)...”;2、利用substring函数,语法为“select substring(指定字段,2)..”。

转换方法:1、利用cast函数,语法“select * from 表名 order by cast(字段名 as SIGNED)”;2、利用“select * from 表名 order by CONVERT(字段名,SIGNED)”语句。

本篇文章给大家带来了关于mysql的相关知识,其中主要介绍了关于MySQL复制技术的相关问题,包括了异步复制、半同步复制等等内容,下面一起来看一下,希望对大家有帮助。

本篇文章给大家带来了关于mysql的相关知识,其中主要介绍了mysql高级篇的一些问题,包括了索引是什么、索引底层实现等等问题,下面一起来看一下,希望对大家有帮助。

在mysql中,可以利用REGEXP运算符判断数据是否是数字类型,语法为“String REGEXP '[^0-9.]'”;该运算符是正则表达式的缩写,若数据字符中含有数字时,返回的结果是true,反之返回的结果是false。


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Dreamweaver CS6
Visuelle Webentwicklungstools

SecLists
SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.

Sicherer Prüfungsbrowser
Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

EditPlus chinesische Crack-Version
Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),
