>데이터 베이스 >몽고DB >복잡한 데이터 변환을 위해 MongoDB의 집계 프레임 워크를 어떻게 사용합니까?

복잡한 데이터 변환을 위해 MongoDB의 집계 프레임 워크를 어떻게 사용합니까?

Robert Michael Kim
Robert Michael Kim원래의
2025-03-11 18:07:08264검색

이 기사는 복잡한 데이터 변환을위한 파이프 라인 기반 도구 인 MongoDB의 집계 프레임 워크를 설명합니다. $ Group, $ Sort, $ MATCH 및 $ MEUBUUP와 같은 단계를 사용하여 총계 계산, 필터링, 컬렉션 가입 및와 같은 세부 사항을 사용하여 세부 사항이 있습니다.

복잡한 데이터 변환을 위해 MongoDB의 집계 프레임 워크를 어떻게 사용합니까?

복잡한 데이터 변환을 위해 MongoDB 집계 프레임 워크 사용 방법

MongoDB Aggregation Framework는 데이터베이스 내에서 직접 복잡한 데이터 변환을 수행하기위한 강력한 도구입니다. 파이프 라인 기반 접근 방식을 사용하여 데이터가 일련의 단계를 통과하여 각각의 특정 작업을 수행합니다. 이 단계에는 필터링, 그룹화, 분류, 투영 등이 포함될 수 있습니다. 예를 들어 설명합시다. 다음과 같은 문서가있는 sales 라는 컬렉션이 있다고 상상해보십시오.

 <code class="json">{ "_id" : ObjectId("5f9f16c75474444444444444"), "item" : "ABC", "price" : 10, "quantity" : 2, "date" : ISODate("2024-01-15T00:00:00Z") } { "_id" : ObjectId("5f9f16c75474444444444445"), "item" : "XYZ", "price" : 20, "quantity" : 1, "date" : ISODate("2024-01-15T00:00:00Z") } { "_id" : ObjectId("5f9f16c75474444444444446"), "item" : "ABC", "price" : 10, "quantity" : 3, "date" : ISODate("2024-01-16T00:00:00Z") }</code>

각 품목의 총 수익을 계산하려면 다음 집계 파이프 라인을 사용합니다.

 <code class="javascript">db.sales.aggregate([ { $group: { _id: "$item", totalRevenue: { $sum: { $multiply: ["$price", "$quantity"] } } } }, { $sort: { totalRevenue: -1 } } ])</code>

이 파이프 라인은 먼저 $group 사용하여 item 필드별로 문서를 그룹화합니다. 그런 다음 각 그룹에 대해 $sum 사용하여 totalRevenue 계산하고 $multiply 가격과 수량을 곱합니다. 마지막으로, 그것은 $sort 사용하여 totalRevenue 의 내림차순 순서로 결과를 정렬합니다. 이것은 복잡한 변형을 위해 여러 단계가 어떻게 연결될 수 있는지 보여줍니다. 다른 공통 단계로는 $match (필터링), $project (필드 선택 및 이름 바꾸기), $unwind (해체 배열) 및 $lookup (다른 컬렉션과 결합 - 나중에 논의)가 있습니다.

MongoDB의 집계 프레임 워크를 넘어 간단한 쿼리를 넘어서 일반적인 사용 사례는 무엇입니까?

특정 기준과 일치하는 문서를 찾는 것과 같은 간단한 쿼리 외에도 집계 프레임 워크는 데이터 조작 및 분석이 필요한 시나리오에서 탁월합니다. 몇 가지 일반적인 사용 사례는 다음과 같습니다.

  • 실시간 분석 : 집계는 스트리밍 데이터를 처리하여 트렌드와 패턴에 대한 즉각적인 통찰력을 제공 할 수 있습니다. 예를 들어, 실시간 또는 모니터링 센서 데이터에서 웹 사이트 트래픽을 추적합니다.
  • 데이터 강화 : 기존 문서에 계산 된 필드 또는 파생 데이터 추가. 여기에는 다른 필드를 기준으로 총계, 평균 또는 비율을 계산하는 것이 포함될 수 있습니다.
  • 보고 및 대시 보드 : 보고서 및 시각화에 대한 요약 된 데이터를 생성합니다. 집계는 데이터를 그룹화하고 집계를 계산하며 쉬운 소비를 위해 결과를 형식화 할 수 있습니다.
  • 데이터 정리 및 변환 : 데이터 유형 변환 또는 구조 조정 문서와 같은보다 유용한 형식으로 데이터를 변환합니다.
  • 복잡한 필터링 및 정렬 : 간단한 쿼리 연산자로 달성하기 어렵거나 불가능한 복잡한 필터링 및 정렬 작업 수행.
  • 복잡한 분석 쿼리 구축 : 이동 평균, 백분위 수 또는 기타 통계 측정과 같은 작업 수행.

대형 데이터 세트로 성능을 위해 MongoDB Aggregation 파이프 라인을 최적화하려면 어떻게해야합니까?

대형 데이터 세트의 집계 파이프 라인 최적화는 성능에 중요합니다. 몇 가지 주요 전략은 다음과 같습니다.

  • 인덱싱 : $match , $sort , $group$lookup 단계에 사용되는 필드에서 적절한 인덱스가 생성되는지 확인하십시오. 인덱스는 데이터 검색 속도를 크게 높입니다.
  • 조기 필터링 : 파이프 라인의 초기에 $match 단계를 사용하여 원치 않는 문서를 가능한 빨리 필터링하십시오. 이렇게하면 후속 단계로 처리 된 데이터의 양이 줄어 듭니다.
  • 단계 수 제한 : 과도한 단계는 처리 속도를 늦출 수 있습니다. 가능한 경우 작업을 통합하십시오.
  • 적절한 집계 연산자 사용 : 작업을 위해 가장 효율적인 연산자를 선택하십시오. 예를 들어, $sum 은 일반적으로 합계 값에 대해 $reduce 보다 빠릅니다.
  • 불필요한 필드 예측을 피하십시오 : $project 단계에서 필요한 필드 만 투사하여 처리 된 데이터 볼륨을 줄입니다.
  • 최적화 $lookup 조인 : 컬렉션에 가입 할 때 가입 컬렉션이 조인 필드에 적절한 인덱스가 있는지 확인하십시오. 복잡한 결합 조건을 위해 letpipeline 과 함께 $lookup 사용하는 것을 고려하십시오.
  • 데이터 샤드 : 매우 큰 데이터 세트의 경우 샤딩은 여러 서버에 대한 데이터를 배포하여 확장 성과 성능을 향상시킵니다.
  • explain() : db.collection.aggregate(...).explain() 메소드를 사용하여 실행 계획을 분석하고 잠재적 인 병목 현상을 식별하십시오.

MongoDB Aggregation Framework를 사용하여 다른 컬렉션에서 조인 또는 조회를 수행 할 수 있습니까?

예, MongoDB Aggregation Framework는 $lookup 단계를 사용하여 다른 컬렉션의 조인 및 조회를 지원합니다. $lookup 왼쪽 외부 조인을 수행하여 지정된 조인 조건을 기반으로 다른 컬렉션의 데이터를 가져옵니다.

예를 들어, customersorders 두 가지 컬렉션을 고려하십시오.

 <code class="json">// customers collection { "_id" : 1, "name" : "John Doe" } { "_id" : 2, "name" : "Jane Smith" } // orders collection { "_id" : 101, "customer_id" : 1, "amount" : 100 } { "_id" : 102, "customer_id" : 1, "amount" : 200 } { "_id" : 103, "customer_id" : 2, "amount" : 50 }</code>

주문과 함께 고객 정보를 검색하려면 다음 집계 파이프 라인을 사용합니다.

 <code class="javascript">db.customers.aggregate([ { $lookup: { from: "orders", localField: "_id", foreignField: "customer_id", as: "orders" } } ])</code>

이 파이프 라인은 customers 과 함께 customers 과 주문의 _id 필드를 기반으로 컬렉션을 orders 하고 orderscustomer_id 필드를 주문합니다. 결과에는 고객의 정보와 orders 필드 내의 관련 주문 배열이 포함됩니다. customers_id 필드에서 인덱스를 작성하고 customer_id 필드를 최적의 성능으로 orders 하십시오. $lookup 단계 내의 letpipeline 옵션을 사용하여보다 복잡한 조정 조건을 달성 할 수 있습니다.

위 내용은 복잡한 데이터 변환을 위해 MongoDB의 집계 프레임 워크를 어떻게 사용합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.