Hadoop은 대용량 데이터를 분산 처리할 수 있는 소프트웨어 프레임워크인 Apache Foundation에서 개발한 분산 시스템 인프라입니다. Hadoop은 안정적이고 효율적이며 확장 가능한 방식으로 데이터를 처리하며 사용자는 기본 세부 사항을 이해하면서 분산 프로그램을 개발할 수 있습니다. 유통의.
사용자는 Hadoop에서 대용량 데이터를 처리하는 애플리케이션을 쉽게 개발하고 실행할 수 있습니다.
Hadoop은 HDFS라고 하는 분산 파일 시스템(Hadoop Distributed File System)을 구현합니다. HDFS는 내결함성이 뛰어나고 저렴한 하드웨어에 배포되도록 설계되었으며 애플리케이션 데이터에 액세스하는 데 높은 처리량을 제공하므로 대규모 데이터 세트가 있는 애플리케이션에 적합합니다. HDFS는 POSIX 요구 사항을 완화하고 스트리밍 액세스 형태로 파일 시스템의 데이터에 액세스할 수 있습니다.
Hadoop 프레임워크의 핵심 디자인은 HDFS와 MapReduce입니다. HDFS는 대용량 데이터에 대한 스토리지를 제공하고 MapReduce는 대용량 데이터에 대한 계산을 제공합니다.
Hadoop은 주로 다음과 같은 장점을 가지고 있습니다.
● 높은 신뢰성. 데이터를 비트 단위로 저장하고 처리하는 Hadoop의 능력은 신뢰할 만한 가치가 있습니다.
● 높은 확장성. Hadoop은 수천 개의 노드로 쉽게 확장할 수 있는 사용 가능한 컴퓨터 클러스터 간에 데이터를 분산하고 컴퓨팅 작업을 완료합니다.
● 효율성이 높습니다. Hadoop은 노드 간에 데이터를 동적으로 이동하고 각 노드의 동적 균형을 보장할 수 있으므로 처리 속도가 매우 빠릅니다.
● 높은 내결함성. Hadoop은 여러 데이터 복사본을 자동으로 저장하고 실패한 작업을 자동으로 재배포할 수 있습니다.
● 저렴한 비용. 일체형 컴퓨터, 상업용 데이터 웨어하우스, QlikView, Yonghong Z-Suite 등의 데이터 마트와 비교할 때 hadoop은 오픈 소스이므로 프로젝트의 소프트웨어 비용이 크게 절감됩니다.
Hadoop은 Java 언어로 작성된 프레임워크와 함께 제공되므로 Linux 프로덕션 플랫폼에서 실행하는 데 이상적입니다. Hadoop의 애플리케이션은 C++와 같은 다른 언어로도 작성할 수 있습니다.
위 내용은 하둡이 뭐야?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!