Heim > Fragen und Antworten > Hauptteil
Ich bin neu im Datenbanksystemdesign. Nachdem ich viele Artikel gelesen habe, bin ich wirklich verwirrt, wie hoch die Grenze ist, die wir für eine Tabelle ohne Sharding oder Partitionierung haben sollten. Ich weiß, dass es wirklich schwierig ist, eine allgemeingültige Antwort zu geben, die Dinge hängen von Faktoren wie
abAber wenn jemand diese Frage stellt
Wenn die Anzahl der Zeilen weniger als eine Million beträgt und die Zeilengröße um Tausende zunimmt, ist die Auswahl einfach. Schwieriger wird es jedoch, wenn die Auswahl Millionen oder Milliarden Zeilen umfasst.
Hinweis: Ich habe die Verzögerungsnummer in der Frage nicht erwähnt. Bitte Antworten Sie basierend auf der Anzahl der Verzögerungen, mit denen Sie zufrieden sind. Außerdem sprechen wir über strukturierte Daten.
Ich bin mir nicht sicher, aber ich kann drei spezifische Fragen hinzufügen:
Hinweis: Bei dieser Frage wird davon ausgegangen, dass wir eine Auswahl treffen SQL-Lösung. Auch wenn der bereitgestellte Anwendungsfall keinen logischen Sinn ergibt, ignorieren Sie ihn. Ziel ist der Erwerb numerischer Kenntnisse.
Kann mir jemand helfen, den Benchmark zu verstehen? Alle reellen Zahlen aus dem Projekt, an dem Sie gerade arbeiten, zeigen, dass es sich bei einer großen Datenbank mit so vielen Abfragen um die beobachtete Latenz handelt. Alles, was mir helfen kann, die Anzahl der ausgewählten Tabellen für eine bestimmte Anzahl von Abfragen und eine bestimmte Latenz zu rechtfertigen.
P粉4019012662024-01-17 09:55:18
MySQL 的一些答案。由于所有数据库都受到磁盘空间、网络延迟等限制,其他引擎可能类似。
SELECT
是可能的。所以你需要了解查询是否是这样病态的。 (我认为这是高“延迟”的一个例子。)PARTITIONing
(尤其是在 MySQL 中)的用途很少。更多详细信息:分区INDEX
对于性能非常重要。每天插入
一百万行不是问题。 (当然,有些模式设计可能会导致这个问题。)经验法则:100/秒可能不是问题; 1000/秒可能是可能的;之后就变得更难了。更多关于高速摄取当您进入大型数据库时,它们分为几种不同的类型;每个都有一些不同的特征。
SPATIAL
或一些技术 此处