Django ORM은 django의 가장 강력한 기능 중 하나입니다. 이는 데이터베이스와의 상호 작용의 복잡성을 상당 부분 추상화하여 개발자가 원시 SQL이 아닌 Python 구문을 사용하여 데이터를 조작할 수 있게 해줍니다. 이러한 모든 ORM 함수는 주의 깊게 처리하지 않으면 병목 현상이 발생할 수 있는 SQL 쿼리를 생성합니다.
이 블로그에서는 Django ORM을 사용할 때 흔히 발생하는 실수를 강조하고 쿼리를 효율적이고 유지 관리 가능하며 성능 좋게 유지하기 위한 팁도 제공합니다.
N 1 쿼리 문제는 코드가 하나의 쿼리를 트리거하여 레코드 집합을 가져온 다음 N개의 추가 쿼리를 다시 실행하여 관련 데이터를 가져올 때 발생합니다.
blogs = Blog.objects.all() # 1 Query for blog in blogs: print(blog.author.name) # N additional queries
위의 예에서 루프 내에서 blog.author.name에 액세스하면 Django가 각 블로그의 작성자 레코드를 개별적으로 가져오고 N개의 추가 쿼리가 발생합니다.
수정 방법
단일 관련 개체(예: ForeignKey 또는 OneToOneField)에 대해 select_관련을 사용하세요. SQL JOIN을 수행하여 하나의 쿼리에서 기본 개체와 관련 개체를 검색하기 때문입니다. 다대다, 다대일 또는 역관계의 경우 관련 데이터를 별도의 쿼리로 가져오지만 Python에서 효율적으로 결합하여 N 1 문제를 방지하는 prefetch_관련을 사용하세요.
# With select_related blogs = Blog.objects.select_related('author').all() # With prefetch_related authors = Author.objects.prefetch_related('blogs').all()
개발자는 종종 여러 필터를 연결하거나 .all()을 사용하고 동일한 쿼리 세트에 대해 반복 쿼리를 사용합니다.
blogs = Blog.objects.all() active_blogs = blogs.filter(is_archived=False) popular_blogs = blogs.filter(views__gte=1000)
Django는 필요할 때만 지연 평가하여 쿼리 세트를 최적화하려고 시도하지만 동일한 쿼리 세트 데이터에 대해 필터를 반복적으로 호출하면 여전히 데이터베이스에 불필요한 히트가 발생할 수 있습니다.
수정 방법
하나의 명령문에 필터를 결합하면 django가 단일 SQL 쿼리를 생성할 수 있습니다.
popular_active_blogs = Blog.objects.filter(is_archived=False, views__gte=1000)
모델의 모든 필드 데이터가 아닌 특정 필드만 필요한 경우도 있습니다. 이 동안 .values() 또는 .values_list()를 사용하는 것이 더 효율적일 수 있습니다.
titles = Blog.objects.values('title') or titles = Blog.objects.values_list('title', flat=True) # values() returns a list of dictionaries. # values_list() can return tuples or flat values if flat=True is provided.
필요한 열만 가져오면 데이터베이스에서 전송되는 데이터의 양이 줄어들어 성능이 향상됩니다.
.aggregate() 또는 .annotate()를 반복적으로 호출하면 여러 쿼리가 발생할 수 있습니다. 여러 주석이 포함된 복잡한 쿼리는 비효율적인 SQL 쿼리로 이어질 수 있으며, 이는 과도한 데이터베이스 작업으로 이어질 수 있습니다.
# Example of multiple aggregate total_count = Blog.objects.aggregate(Count('id')) author_count = Blog.objects.aggregate(Count('author')) average_views = Blog.objects.aggregate(Avg('views'))
추천
blogs = Blog.objects.all() # 1 Query for blog in blogs: print(blog.author.name) # N additional queries
인덱싱은 데이터베이스가 데이터를 신속하게 찾고 검색할 수 있도록 하여 쿼리 성능을 향상시키고 느린 전체 테이블 스캔을 방지합니다. 인덱스는 필터링, 정렬, 조인과 같은 작업을 최적화하여 자주 액세스하는 필드에 대한 쿼리를 훨씬 빠르게 만듭니다. 자주 쿼리하는 필드에 데이터베이스 인덱스가 없으면 성능이 크게 저하될 수 있습니다.
Django에서 인덱스를 추가하는 방법
# With select_related blogs = Blog.objects.select_related('author').all() # With prefetch_related authors = Author.objects.prefetch_related('blogs').all()
색인은 읽기 속도를 높일 수 있지만 쓰기 속도를 늦출 수 있습니다. 따라서 자주 쿼리해야 하는 필드만 색인화하세요.
계산 비용이 많이 들거나 거의 변경되지 않는 데이터를 쿼리해야 하는 경우 캐싱을 사용합니다. 5분이라도 캐싱하면 반복 쿼리, 복잡한 계산, 자주 변경되지 않는 쿼리를 줄일 수 있습니다.
blogs = Blog.objects.all() active_blogs = blogs.filter(is_archived=False) popular_blogs = blogs.filter(views__gte=1000)
Django ORM이 복잡한 쿼리나 대량 작업을 효율적으로 표현하지 못하는 경우가 있습니다. Django는 .extra() 또는 .raw()를 제공하지만 원시 SQL 사용은 다음과 같은 이유로 최후의 수단이 되어야 합니다.
입력이 적절하게 삭제되고 원시 SQL 쿼리를 유지 관리할 수 있도록 유지합니다.
이러한 팁을 적용하면 코드를 깔끔하고 유지 관리하기 쉽게 유지하면서 Django 앱의 성능을 향상할 수 있습니다. 또한 개발 환경에서 Django 디버그 툴바를 사용하여 실행된 쿼리 수, 실행 시간 및 SQL 문을 모니터링하고 분석하는 것이 좋습니다.
위 내용은 해결해야 할 일반적인 Django ORM 실수의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!