So verbessern Sie die Gruppierungsgeschwindigkeit

Question

Ich habe eine große Tabelle mit über 3 Milliarden Zeilen und die Ausführung meiner Abfrage dauert jetzt 3 Tage. Dies ist meine Abfrage: insertintofrequentwords(word,frequenz,filename)selectword,count(*)asfrequenz,max(filename)fromallwordstempgroupbyword Grundsätzlich besteht meine Abfrage darin, nach Wörtern aus der allwordstemp-Tabelle zu gruppieren, und ich möchte wissen, wann

P粉741678385 · Answer

您的筛选条件似乎是基于频率，而不是单词或文件名。所以我首先会按频率对所有单词进行索引。

然后，假设频率是一个整数，我会添加一个WHERE子句，如下所示：

select word, max(filename)
from allwordstemp
where frequency = 1
group by word

以上将给您提供一个在各种文件名中仅出现一次的所有单词列表。

希望这对您有所帮助，祝一切顺利！

So verbessern Sie die Gruppierungsgeschwindigkeit

Antworte allen(1)Ich werde antworten