>  기사  >  데이터 베이스  >  mysql 다차원 데이터 웨어하우스 가이드란 무엇입니까?

mysql 다차원 데이터 웨어하우스 가이드란 무엇입니까?

(*-*)浩
(*-*)浩원래의
2019-05-09 15:03:142576검색

MySQL 다차원 데이터 웨어하우스 가이드는 실용적인 책입니다. MySQL 데이터베이스를 사용하게 되지만 이 책은 MySQL에 관한 것이 아닙니다. 이 책에서는 하드웨어 아키텍처 문제를 다루지 않습니다. 이 책은 주로 데이터 웨어하우스의 설계 및 개발 기술에 대해 다루고 있다. mysql 다차원 데이터 웨어하우스 가이드에 오신 것을 환영합니다.

추천 강좌: MySQL Tutorial

mysql 다차원 데이터 웨어하우스 가이드란 무엇입니까?

데이터 웨어하우스는 현재의 거래 운영 및 관리 정보 시스템은 물론 다양한 외부 정보 소스를 포함한 다양한 데이터를 통합하여 정보를 통합할 수 있습니다. 이러한 소스 데이터는 통합, 정리, 변환되며, 이러한 데이터 소스에서 직접 데이터를 읽어야 하는 경우 해당 데이터는 보다 운영 친화적인 방식으로 데이터 웨어하우스에 저장됩니다.

데이터 웨어하우스에서 데이터가 구조화되는 방식을 통해 현재 및 과거 데이터를 저장할 수 있습니다. 현재 데이터는 실제 거래 운영 활동에 필요하며 일반적으로 정기적인 하드 카피(예: 인쇄된 보고서) 또는 온라인 보고서 형식입니다. 활용이 쉽지 않은 과거 데이터는 장기 계획과 전략적 시장 결정에 중요한 추적, 추론 분석, 비교 등 시점 분석을 기반으로 한 비즈니스 정보를 제공할 수 있습니다.

여러 정보 소스의 정보를 통합하는 방법, 정기적으로 저장하는 방법, 효과적인 수요 설계 및 개발 기술은 모두 거래 관리 정보 시스템에 적용되는 기술과 매우 다릅니다. 이 책은 데이터 웨어하우스 설계 및 개발 기술에 관한 모든 내용을 담고 있으며, 데이터 웨어하우스 구축과 관련된 대부분의 기술적 문제를 다룹니다. 더 중요한 것은 이 책이 실용적인 데이터 웨어하우스 개발을 위한 이해하기 쉬운 방법 가이드를 제공한다는 것입니다.

이 책의 적용 범위

MySQL 다차원 데이터 웨어하우스 가이드는 실용서입니다. MySQL 데이터베이스를 사용하게 되지만 이 책은 MySQL에 관한 것이 아닙니다. 이 책에서는 하드웨어 아키텍처 문제를 다루지 않습니다.

이 책은 주로 데이터 웨어하우스의 설계와 개발 기술에 대해 다루고 있습니다. 개발 프로젝트 관리, 이론, 개발을 주도하는 방법 등 관련 기술 문제는 포함되지 않습니다.

이 책은 데이터 웨어하우스 개발 사례를 통해 기술이 어떻게 적용되는지 보여줍니다. 실제 데이터 웨어하우스 개발에 적합한 데이터 모델과 SQL 스크립트를 제공합니다. 이 스크립트는 mysql 버전 5.0.21을 사용하는 Windows XP Professional SP2 플랫폼에서 테스트되었습니다.

또한 이 책에서는 다음 주제에 대해 더 이상 구체적으로 논의하지 않습니다.

데이터 웨어하우스의 개념

Sql

MySQL 데이터베이스

이 책을 읽는 사람들에게 적합:

데이터 웨어하우스는 다양한 조직 및 상업기관, 정부부처, 비영리단체, 학교, 제조업에서 소매점, 금융기관에서 의료기관, 전통회사에서 인터넷 상인까지.

이 책은 무엇보다도 데이터 웨어하우스 개발자를 대상으로 작성되었습니다. 그러나 IT 관리자와 기타 IT 전문가, 특히 MIS(비즈니스 보고) 및 DSS(의사결정 지원 애플리케이션)에 관심이 있는 사람들에게는 이 책이 똑같이 유용할 것입니다. 일반적으로 이 책은 분석 응용을 위한 데이터 준비에 관련된 사람들과 인쇄된 보고서 및 온라인 보고서와 같은 정보를 제출해야 하는 사람들을 위해 작성되었습니다.

이 책은 데이터 웨어하우스 초보자에게도 적합합니다. 첫 번째 데이터 웨어하우스 개발을 준비하는 사람들에게 빠르고 직접적인 도움이 될 것입니다.

교사와 학생은 이 책을 교과서로 사용하여 데이터 웨어하우스 원리와 개념에 대한 이해를 명확히 할 수 있습니다. 대부분의 장은 실험실 연습에 맞게 사용자 정의할 수 있습니다.

준비된 기술

이 책은 IT 초보자를 위한 책이 아닙니다. 이 책을 보다 효과적으로 사용하려면 독자가 어느 정도 시스템 개발 경험이 있어야 합니다. 그러나 데이터 웨어하우스 구축에 대한 사전 경험이 필수는 아닙니다.

이 책에 나오는 예제를 연습하려면 RDBMS(관계형 데이터베이스 관리 시스템)와 SQL에 대한 실무 능력이 필요합니다.

이 책에서 얻을 수 있는 것

비즈니스 영업 관련 데이터를 먼저 저장하는 데이터 웨어하우스, 단 하나의 예를 통해 데이터 웨어하우스 지식과 실무 능력을 연마하고 실습할 수 있을 것입니다. 이 예는 실제 데이터 웨어하우스를 단순화한 버전으로, 프로토타입은 다양한 비즈니스 유형에서 찾아볼 수 있습니다.

이 책에서 소개하는 기술을 활용하여 MySQL 데이터베이스를 기반으로 이 예제의 판매 관련 데이터 웨어하우스를 단계별로 개발해 보겠습니다. 이러한 기술은 일반적인 데이터 웨어하우스 개발에서 직면하게 될 문제에 대한 분해 기술입니다. 이 기사를 완료하고 모든 연습을 완료하면 관련 업무 경험을 쌓고 첫 번째 실제 데이터 웨어하우스 프로젝트를 담당할 준비를 갖추게 됩니다.

장 개요

이 책은 25개의 장과 부록으로 구성되어 있습니다. 모든 장은 네 부분으로 구성되어 있습니다. 첫 번째 부분에서는 데이터 웨어하우징 기본 사항을 다룹니다. 두 번째 부분에서는 원시 데이터에서 데이터 웨어하우스로의 마이그레이션을 설명합니다. 3부에서는 데이터 웨어하우스의 발전을 제어하는 ​​방법을 논의합니다. 네 번째 부분에는 몇 가지 고급 다차원 기술이 포함됩니다. 다음 섹션에서는 각 장의 미리보기를 제공합니다.

1부 기본 원리

1부에서는 다차원 데이터 웨어하우스의 기본 원리를 다루며 4개 장으로 구성됩니다.

1장 '기본 구성 요소'에서는 스타 스키마(다차원 테이블로 둘러싸인 팩트 테이블이 있는 데이터베이스 스키마)를 소개하고 스키마의 기본 구성 요소를 설명합니다.

2장 "차원 기록"에서는 차원 구성원의 기록 기록을 유지하기 위해 프록시 키를 사용하는 방법을 소개합니다.

3장 "측정값 가산성"에서는 차원 데이터 웨어하우스의 가장 중요한 기능 중 하나인 데이터 웨어하우스 팩트 테이블에 저장된 측정값의 가산성을 다룹니다.

4장 "차원 쿼리"에서는 스타 스키마에 가장 적합한 SQL 쿼리를 소개합니다. 차원 쿼리를 사용하면 차원 데이터 웨어하우스에 단순성과 효율성이라는 두 가지 가장 기본적인 설계 지표가 있는지 여부를 증명할 수 있습니다.

2부: 추출, 변환 및 로드

이 문서의 5개 장 모두 데이터 통합, 팩트 테이블 및 차원 테이블을 포함합니다.

5장 '소스 데이터 추출'에서는 다양한 유형의 데이터 추출을 소개합니다.

6장 "시간 차원 가져오기"에서는 시간 차원을 로드하는 가장 일반적인 세 ​​가지 기술을 다룹니다.

7장 "초기 가져오기" 및 8장 "정기 가져오기"에는 초기 가져오기와 주기적 가져오기라는 두 가지 유형의 가져오기 기술이 포함됩니다.

2번째 기사의 요약인 9장 "정기적 가져오기 계획"에서는 Windows 작업 관리자를 사용하여 정기적인 가져오기 계획을 구현하는 방법에 대한 고급 가이드를 제공합니다.

3부: 성장

3부에서는 성공적인 다차원 데이터 웨어하우스의 성장 과정에서 직면하는 관련 문제를 주로 다루는 다양한 처리 기술을 소개합니다. 이 부분은 10개의 챕터로 구성되어 있습니다.

10장 "필드 추가"에서는 기존 데이터 웨어하우스의 테이블에 필드를 추가하는 기술적인 문제에 대해 설명합니다.

11장 "온디맨드 로딩"에는 온디맨드 로딩 기술이 포함됩니다.

12장 '차원 테이블 하위 집합'에서는 사용자가 차원 테이블 하위 집합 문제를 처리하는 데 도움이 되는 관련 기술을 소개합니다.

13장 "차원 역할극"에서는 팩트 테이블에서 동일한 차원을 여러 번 사용하는 방법을 설명합니다.

14장 "스냅샷"을 사용하면 데이터를 요약해야 할 때 빠른 성능 쿼리를 제공할 수 있습니다.

15장, "차원 전용 계층" 및 16장, "다중 경로 및 비정형 차원 계층"은 단순 다중 경로 차원 기술에 대해 설명하며 이에 따라 이러한 기술은 집계 및 드릴다운 분석을 수행하는 데 도움이 됩니다.

17장, "차원 축소"에서는 차원 축소 기술을 사용하여 데이터 웨어하우스 스키마의 복잡성을 줄이는 방법을 보여줍니다.

18장 '가비지 차원'에서는 가비지 차원 기술, 즉 겉보기에는 관련성이 없어 보이지만 종종 사용자가 분석해야 하는 데이터를 차원적으로 정리하는 기술에 대해 설명합니다.

19장 "다중 스타 스키마"에서는 스키마에 다중 스타 스키마를 추가하는 방법을 보여줍니다.

4부: 첨단 기술

6개의 장으로 구성되어 있습니다.

20장 '불완전한 데이터 소스'에서는 데이터 웨어하우스에서 구조가 대상 테이블에 직접 매핑될 수 없는 데이터 소스를 처리하는 방법을 소개합니다.

21장, "팩트 없는 팩트 테이블"에서는 고객이 분석할 수 있는 일종의 보조 데이터, 즉 팩트 필드가 없는 팩트 테이블을 생성하는 데 도움을 줍니다. 이 데이터는 데이터 소스에서 직접 측정할 수 없습니다.

22장 "Late Facts"에는 계획된 로드 시간 이전에 데이터 소스의 특정 사실이 생성되지 않는 상황을 처리하는 기술이 포함되어 있습니다.

23장, "외부 데이터 소스 및 차원 병합"에는 외부 데이터 소스를 처리하는 기술과 여러 차원에 흩어져 있는 속성을 하나의 차원으로 병합하는 방법이라는 두 가지 주제가 포함되어 있습니다.

24장 '누적 측정값'에서는 계산 측정값과 누적 측정값의 비가산성이라는 두 가지 관련 문제를 논의합니다.

25장 '분할 차원'에서는 사용자가 연속 값을 갖는 속성에 대한 데이터 분석을 수행하는 데 도움이 될 수 있는 기술을 설명합니다.

Appendix

부록a, "포맷 파일 데이터 소스"에서는 이 책의 예제를 통해 포맷 파일 데이터 소스를 사용하는 방법을 소개합니다.

가장 인기 있는 오픈 소스 데이터베이스 소프트웨어인 MySQL을 데이터 웨어하우스 애플리케이션에 사용하는 방법은 이 책 이전에는 다차원 데이터 웨어하우스 생성에 대한 입문 가이드에서 소개된 적이 없습니다. 주제에는 스타 스키마 모델링, 데이터 로딩(데이터 추출, 변환 및 로딩: etl), 테스트 검증 및 다차원 쿼리가 포함됩니다. 이 책은 처음부터 끝까지 실용적이고 비교적 간소화된 실제 프로젝트를 사용합니다. 포괄적이고 접근 가능한 작성 형식을 통해 데이터 웨어하우스를 구축해야 하는 프로그래머가 관련 예제와 정보를 사용할 수 있습니다.

저자 소개

Djoni Darmawikarta는 한때 IBM에서 근무했으며 현재는 캐나다 보험 회사의 데이터 웨어하우스 및 비즈니스 인텔리전스 팀의 기술 전문가입니다. 현재 온타리오 주 토론토에 거주 중

위 내용은 mysql 다차원 데이터 웨어하우스 가이드란 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.