이 기사는 복잡한 데이터 변환을위한 파이프 라인 기반 도구 인 MongoDB의 집계 프레임 워크를 설명합니다. $ Group, $ Sort, $ MATCH 및 $ MEUBUUP와 같은 단계를 사용하여 총계 계산, 필터링, 컬렉션 가입 및와 같은 세부 사항을 사용하여 세부 사항이 있습니다.
MongoDB Aggregation Framework는 데이터베이스 내에서 직접 복잡한 데이터 변환을 수행하기위한 강력한 도구입니다. 파이프 라인 기반 접근 방식을 사용하여 데이터가 일련의 단계를 통과하여 각각의 특정 작업을 수행합니다. 이 단계에는 필터링, 그룹화, 분류, 투영 등이 포함될 수 있습니다. 예를 들어 설명합시다. 다음과 같은 문서가있는 sales
라는 컬렉션이 있다고 상상해보십시오.
<code class="json">{ "_id" : ObjectId("5f9f16c75474444444444444"), "item" : "ABC", "price" : 10, "quantity" : 2, "date" : ISODate("2024-01-15T00:00:00Z") } { "_id" : ObjectId("5f9f16c75474444444444445"), "item" : "XYZ", "price" : 20, "quantity" : 1, "date" : ISODate("2024-01-15T00:00:00Z") } { "_id" : ObjectId("5f9f16c75474444444444446"), "item" : "ABC", "price" : 10, "quantity" : 3, "date" : ISODate("2024-01-16T00:00:00Z") }</code>
각 품목의 총 수익을 계산하려면 다음 집계 파이프 라인을 사용합니다.
<code class="javascript">db.sales.aggregate([ { $group: { _id: "$item", totalRevenue: { $sum: { $multiply: ["$price", "$quantity"] } } } }, { $sort: { totalRevenue: -1 } } ])</code>
이 파이프 라인은 먼저 $group
사용하여 item
필드별로 문서를 그룹화합니다. 그런 다음 각 그룹에 대해 $sum
사용하여 totalRevenue
계산하고 $multiply
가격과 수량을 곱합니다. 마지막으로, 그것은 $sort
사용하여 totalRevenue
의 내림차순 순서로 결과를 정렬합니다. 이것은 복잡한 변형을 위해 여러 단계가 어떻게 연결될 수 있는지 보여줍니다. 다른 공통 단계로는 $match
(필터링), $project
(필드 선택 및 이름 바꾸기), $unwind
(해체 배열) 및 $lookup
(다른 컬렉션과 결합 - 나중에 논의)가 있습니다.
특정 기준과 일치하는 문서를 찾는 것과 같은 간단한 쿼리 외에도 집계 프레임 워크는 데이터 조작 및 분석이 필요한 시나리오에서 탁월합니다. 몇 가지 일반적인 사용 사례는 다음과 같습니다.
대형 데이터 세트의 집계 파이프 라인 최적화는 성능에 중요합니다. 몇 가지 주요 전략은 다음과 같습니다.
$match
, $sort
, $group
및 $lookup
단계에 사용되는 필드에서 적절한 인덱스가 생성되는지 확인하십시오. 인덱스는 데이터 검색 속도를 크게 높입니다.$match
단계를 사용하여 원치 않는 문서를 가능한 빨리 필터링하십시오. 이렇게하면 후속 단계로 처리 된 데이터의 양이 줄어 듭니다.$sum
은 일반적으로 합계 값에 대해 $reduce
보다 빠릅니다.$project
단계에서 필요한 필드 만 투사하여 처리 된 데이터 볼륨을 줄입니다.$lookup
조인 : 컬렉션에 가입 할 때 가입 컬렉션이 조인 필드에 적절한 인덱스가 있는지 확인하십시오. 복잡한 결합 조건을 위해 let
및 pipeline
과 함께 $lookup
사용하는 것을 고려하십시오.explain()
: db.collection.aggregate(...).explain()
메소드를 사용하여 실행 계획을 분석하고 잠재적 인 병목 현상을 식별하십시오. 예, MongoDB Aggregation Framework는 $lookup
단계를 사용하여 다른 컬렉션의 조인 및 조회를 지원합니다. $lookup
왼쪽 외부 조인을 수행하여 지정된 조인 조건을 기반으로 다른 컬렉션의 데이터를 가져옵니다.
예를 들어, customers
과 orders
두 가지 컬렉션을 고려하십시오.
<code class="json">// customers collection { "_id" : 1, "name" : "John Doe" } { "_id" : 2, "name" : "Jane Smith" } // orders collection { "_id" : 101, "customer_id" : 1, "amount" : 100 } { "_id" : 102, "customer_id" : 1, "amount" : 200 } { "_id" : 103, "customer_id" : 2, "amount" : 50 }</code>
주문과 함께 고객 정보를 검색하려면 다음 집계 파이프 라인을 사용합니다.
<code class="javascript">db.customers.aggregate([ { $lookup: { from: "orders", localField: "_id", foreignField: "customer_id", as: "orders" } } ])</code>
이 파이프 라인은 customers
과 함께 customers
과 주문의 _id
필드를 기반으로 컬렉션을 orders
하고 orders
의 customer_id
필드를 주문합니다. 결과에는 고객의 정보와 orders
필드 내의 관련 주문 배열이 포함됩니다. customers
의 _id
필드에서 인덱스를 작성하고 customer_id
필드를 최적의 성능으로 orders
하십시오. $lookup
단계 내의 let
및 pipeline
옵션을 사용하여보다 복잡한 조정 조건을 달성 할 수 있습니다.
위 내용은 복잡한 데이터 변환을 위해 MongoDB의 집계 프레임 워크를 어떻게 사용합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!