오늘날 빅데이터와 분석은 더욱 성숙한 배포 단계에 진입하고 있습니다. 이는 이러한 기술을 배포하고 회사를 위한 빅 데이터 아키텍처를 정의하는 데 어려움을 겪고 있는 중소기업에게 좋은 소식입니다.
빅 데이터 및 분석의 전체 아키텍처를 정의하는 방법에 대한 불확실성은 중소기업이 빅 데이터 및 분석 배포에 뒤처지는 이유 중 하나입니다. 많은 경우 그들은 하이브리드 컴퓨팅, 데이터 마트, 마스터 데이터베이스 등과 같은 트렌드가 어떻게 발전하고 보안 및 거버넌스에 대한 통제가 어떻게 이루어질지 기다리고 지켜보고 있습니다.
마지막으로 누구나 따를 수 있는 새로운 모범 사례 데이터 아키텍처가 제공됩니다. 이 아키텍처에서는 클라우드 컴퓨팅 서비스가 빅 데이터를 저장하고 처리하는 데 사용되고, 온프레미스 데이터 센터는 기업 내 로컬 데이터 마트를 개발하는 데 사용됩니다.
이 빅 데이터 및 분석 아키텍처의 이유를 자세히 살펴보겠습니다.
기업 규모가 작을 경우 데이터 센터에서 빅데이터를 병렬로 처리하기 위해 서버 클러스터를 구입하는 데 비용이 많이 듭니다. 병렬 처리 환경을 최적화, 업그레이드 및 유지하는 방법을 아는 매우 값비싼 전문가를 고용하거나 교육하는 것은 말할 것도 없습니다. 현장에서 데이터를 처리하고 저장하기로 선택한 기업은 하드웨어, 소프트웨어 및 저장 장비에도 상당한 투자를 합니다. 빅데이터 하드웨어와 소프트웨어를 조달하고, 컴퓨팅 처리와 스토리지를 클라우드에 아웃소싱하는 데는 모두 많은 비용이 듭니다.
데이터 거버넌스(예: 보안 및 규정 준수 문제)는 관리하기가 더 어렵기 때문에 기업이 모든 미션 크리티컬 데이터를 클라우드에 전달하는 것을 꺼리는 이유 중 하나입니다. 따라서 데이터가 클라우드에서 처리되면 많은 기업은 데이터를 자체 온프레미스 데이터 센터로 마이그레이션하기로 선택합니다.
많은 기업이 데이터 센터를 선택하는 또 다른 이유는 고객이 클라우드에서 개발한 모든 애플리케이션을 공유할 수 있다는 것이 많은 클라우드 컴퓨팅 제공업체의 정책이기 때문에 이 데이터를 개발하는 독점 애플리케이션과 알고리즘에 집중하기 위해서입니다. 다른 고객과 함께.
데이터 센터에서 온프레미스 애플리케이션을 유지하고 소규모 데이터 마트를 분리할 수 있는 온프레미스 마스터 데이터 세트를 개발함으로써 기업은 데이터와 애플리케이션을 직접 제어할 수 있습니다.
예를 들어 기업에서 데이터를 익명화해야 하는 경우 클라우드 제공업체가 익명화를 수행하므로 구현하는 프로세스를 문서화하고 클라우드 제공업체와 동의해야 합니다. 기업이 자체 데이터를 정리하려는 경우 클라우드 컴퓨팅 제공업체에 정리 프로세스에 대한 자세한 서면 지침도 제공해야 합니다. 예를 들어, 기업에서는 미국의 모든 주(예: "Tenn" 및 "Tennessee" = "TN")에 대한 약어를 통합하기를 원합니까, 아니면 데이터를 균일하고 처리하기 쉽게 만들기 위해 데이터를 편집합니까? 귀하의 비즈니스가 클라우드 컴퓨팅 서비스 공급자의 전용 테넌트에서 실행되든 멀티 테넌트 환경에서 실행되든, 클라우드 컴퓨팅 공급자는 기업의 데이터가 다른 고객과 절대 공유되지 않도록 보장할 수 있어야 합니다.
기업의 많은 IT 부서가 이 작업을 완전히 놓치고 있습니다. 그들은 빅 데이터 프로젝트 구현을 시작했지만 기존 애플리케이션 개발 정책과 절차가 트랜잭션의 애플리케이션 도메인에서 나온다는 사실을 잊어버렸습니다. 기업은 이런 실수를 해서는 안 됩니다. 대신 기업은 빅데이터와 상호작용할 가능성이 더 높은 영역(예: 스토리지, 데이터베이스 관리, 애플리케이션)의 정책과 절차를 수정해야 합니다.
클라우드 기반 DR 테스트의 경우 조직은 DR 기록 및 실행에 대한 조항을 계약에 포함해야 합니다. 트랜잭션 데이터 및 시스템에 중점을 둔 재해 복구(DR) 계획도 최신 상태로 유지해야 하며 빅 데이터 및 분석을 위한 복구 및 테스트 스크립트를 포함해야 합니다.
위 내용은 빅데이터 처리를 위해 중소기업이 하이브리드 클라우드를 채택하는 세 가지 모범 사례의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!