Heim >Backend-Entwicklung >Python-Tutorial >Häufige Django ORM-Fehler, die behoben werden müssen
Django ORM ist eine der leistungsstärksten Funktionen von Django. Es abstrahiert einen Großteil der Komplexität der Interaktion mit Datenbanken und ermöglicht es Entwicklern, Daten mit Pythonic-Syntax statt mit reinem SQL zu bearbeiten. Alle diese ORM-Funktionen generieren SQL-Abfragen, die bei unsachgemäßer Handhabung zu einem Engpass werden können.
Dieser Blog beleuchtet häufige Fehler bei der Verwendung von Django ORM und bietet außerdem Tipps, wie Abfragen effizient, wartbar und leistungsfähig bleiben.
Das N 1-Abfrageproblem tritt auf, wenn Ihr Code eine Abfrage auslöst, um eine Reihe von Datensätzen abzurufen, und dann erneut N zusätzliche Abfragen ausführt, um zugehörige Daten abzurufen.
blogs = Blog.objects.all() # 1 Query for blog in blogs: print(blog.author.name) # N additional queries
Im obigen Beispiel führt der Zugriff auf blog.author.name innerhalb der Schleife dazu, dass Django den Autorendatensatz für jedes Blog einzeln abruft, was zu N zusätzlichen Abfragen führt.
So beheben Sie das Problem
Verwenden Sie select_related für einzelne verwandte Objekte (z. B. ForeignKey oder OneToOneField), da ein SQL JOIN ausgeführt wird, um das Hauptobjekt und seine zugehörigen Objekte in einer Abfrage abzurufen. Für Viele-zu-Viele-, Viele-zu-Eins- oder umgekehrte Beziehungen verwenden Sie prefetch_lated, das verwandte Daten in separaten Abfragen abruft, diese aber effizient in Python kombiniert und so das N 1-Problem vermeidet.
# With select_related blogs = Blog.objects.select_related('author').all() # With prefetch_related authors = Author.objects.prefetch_related('blogs').all()
Entwickler verketten häufig mehrere Filter oder verwenden .all() gefolgt von wiederholten Abfragen für denselben Abfragesatz:
blogs = Blog.objects.all() active_blogs = blogs.filter(is_archived=False) popular_blogs = blogs.filter(views__gte=1000)
Obwohl Django versucht, Abfragesätze zu optimieren, indem es sie nur bei Bedarf langsam auswertet, kann das wiederholte Aufrufen von Filtern für dieselben Abfragesatzdaten dennoch zu unnötigen Treffern in der Datenbank führen.
So beheben Sie das Problem
Durch die Kombination von Filtern in einer Anweisung kann Django eine einzelne SQL-Abfrage generieren.
popular_active_blogs = Blog.objects.filter(is_archived=False, views__gte=1000)
Manchmal benötigen wir nur bestimmte Felder und nicht alle Felddaten des Modells. Dabei kann die Verwendung von .values() oder .values_list() effizienter sein.
titles = Blog.objects.values('title') or titles = Blog.objects.values_list('title', flat=True) # values() returns a list of dictionaries. # values_list() can return tuples or flat values if flat=True is provided.
Indem Sie nur die benötigten Spalten abrufen, reduzieren Sie die aus der Datenbank übertragene Datenmenge und verbessern so die Leistung.
Der wiederholte Aufruf von .aggregate() oder .annotate() kann mehrere Abfragen verursachen. Komplexe Abfragen mit mehreren Anmerkungen können zu ineffizienten SQL-Abfragen führen, was zu umfangreichen Datenbankoperationen führen kann.
# Example of multiple aggregate total_count = Blog.objects.aggregate(Count('id')) author_count = Blog.objects.aggregate(Count('author')) average_views = Blog.objects.aggregate(Avg('views'))
Empfehlung
blogs = Blog.objects.all() # 1 Query for blog in blogs: print(blog.author.name) # N additional queries
Die Indizierung verbessert die Abfrageleistung, indem sie es der Datenbank ermöglicht, Daten schnell zu finden und abzurufen, wodurch langsame vollständige Tabellenscans vermieden werden. Indizes optimieren Vorgänge wie Filtern, Sortieren und Zusammenführen, wodurch Abfragen in Feldern, auf die häufig zugegriffen wird, wesentlich schneller erfolgen. Ein fehlender Datenbankindex für häufig abgefragte Felder kann die Leistung drastisch reduzieren.
So fügen Sie Indizes in Django hinzu
# With select_related blogs = Blog.objects.select_related('author').all() # With prefetch_related authors = Author.objects.prefetch_related('blogs').all()
Indizes können das Lesen beschleunigen, aber die Schreibgeschwindigkeit verlangsamen. Indizieren Sie also nur die Felder, die Sie häufig abfragen müssen.
Verwenden Sie Caching, wenn wir Daten abfragen müssen, deren Berechnung teuer ist oder die sich selten ändern. Selbst das Caching von 5 Minuten kann wiederholte Abfragen, komplexe Berechnungen und sich selten ändernde Abfragen ersparen.
blogs = Blog.objects.all() active_blogs = blogs.filter(is_archived=False) popular_blogs = blogs.filter(views__gte=1000)
Manchmal kann der Django ORM eine komplexe Abfrage oder einen Massenvorgang nicht effizient ausdrücken. Während Django .extra() oder .raw() anbietet, sollte die Verwendung von Raw-SQL der letzte Ausweg sein, weil es:
Stellen Sie sicher, dass die Eingaben ordnungsgemäß bereinigt werden und dass rohe SQL-Abfragen wartbar bleiben.
Wenn Sie diese Tipps anwenden, verbessern Sie die Leistung Ihrer Django-App und halten gleichzeitig den Code sauber und wartbar. Außerdem wird empfohlen, die Django Debug Toolbar in Ihrer Entwicklungsumgebung zu verwenden, um die Anzahl der ausgeführten Abfragen, ihre Ausführungszeit und SQL-Anweisungen zu überwachen und zu analysieren.
Das obige ist der detaillierte Inhalt vonHäufige Django ORM-Fehler, die behoben werden müssen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!