"Filtrer" d'énormes tables MariaDB/Mysql basées sur différentes tables

Question

Traitement de grands ensembles de données dans ma base de données mariaDB. J'ai deux tables, la table A contient 57 millions de lignes et la table B contient environ 500 lignes. Le tableau B est un sous-ensemble d'identifiants liés aux colonnes du tableau A. Je souhaite supprimer toutes les lignes sans ID correspondant dans une table B. Exemple de table A : classification_id nom 20 Mercedes 30 Kawasaki 80 Leitz 70 HP Exemple de table B : classification_id type 20 voiture 30 vélo 40 bus 50 bateau Donc, dans Dans cet exemple, le les deux dernières lignes du tableau A seront supprimées (ou seront créées

P粉258083432 · Answer

Puisque vous dites que la table filtrée contient un nombre relativement petit de lignes, votre meilleure option est de créer une table séparée avec la table d'origine A 相同的列以及与您的匹配的行criteria，然后替换原始表并删除它。另外，对于如此数量的 ID，您可能希望使用 WHERE IN () plutôt qu'une jointure - tant que les champs que vous utilisez sont indexés, ce sera généralement le cas Le way est plus rapide. Rassembler le tout :

CREATE TABLE new_A AS SELECT A.* FROM A WHERE classification_id IN (SELECT classification_id FROM B); RENAME TABLE A TO old_A, new_A to A; DROP TABLE old_A;

À noter :

Sauvegardez vos données ! Et testez minutieusement la requête avant d’exécuter DROP TABLE. Vous ne voulez pas perdre 57 millions de lignes de données à cause de réponses aléatoires sur StackOverflow.

if A 有任何索引或外键，这些将不会被复制 - 因此您必须手动重新创建它们。我建议首先运行 SHOW CREATE TABLE A 并记下其结构。或者，您可以考虑使用 SHOW CREATE TABLE A 的输出作为模板显式创建表 new_A，然后执行 INSERT INTO new_A SELECT ... 而不是 CREATE TABLE new_A AS SELECT ... et utilisez la même requête après cela.

P粉155832941 · Answer

Essayez ceci :

delete from "table A" where classification_id not in (select classification_id from "table B");

classification_id	Type
20	Voitures
30	Vélo
40	Bus
50	Bateau

"Filtrer" d'énormes tables MariaDB/Mysql basées sur différentes tables

répondre à tous(2)je répondrai