>운영 및 유지보수 >Apache >hadoop의 핵심은 분산 파일 시스템 hdfs이고 무엇입니까?

hadoop의 핵심은 분산 파일 시스템 hdfs이고 무엇입니까?

青灯夜游
青灯夜游원래의
2020-08-31 14:17:148243검색

하둡의 핵심은 분산 파일 시스템인 hdfs와 MapReduce입니다. HDFS는 대용량 데이터에 대한 스토리지를 제공하고 MapReduce는 대용량 데이터에 대한 계산을 제공합니다.

hadoop의 핵심은 분산 파일 시스템 hdfs이고 무엇입니까?

Hadoop은 Apache Foundation에서 개발한 분산 시스템 인프라입니다. 사용자는 배포의 기본 세부 사항을 이해하지 않고도 분산 프로그램을 개발할 수 있습니다. 고속 컴퓨팅 및 스토리지를 위해 클러스터의 기능을 최대한 활용하세요.

Hadoop은 분산 파일 시스템(Hadoop Distributed File System)을 구현하며, 해당 구성 요소 중 하나는 HDFS입니다. HDFS는 내결함성이 뛰어나고 저렴한 하드웨어에 배포되도록 설계되었으며 애플리케이션 데이터에 액세스하는 데 높은 처리량을 제공하므로 대규모 데이터 세트가 있는 애플리케이션에 적합합니다.

HDFS는 POSIX 요구 사항을 완화하고 스트리밍 액세스 형태로 파일 시스템의 데이터에 액세스할 수 있습니다.

Hadoop 프레임워크의 핵심 디자인은 HDFS와 MapReduce입니다. HDFS는 대용량 데이터에 대한 스토리지를 제공하고 MapReduce는 대용량 데이터에 대한 계산을 제공합니다.

Hadoop은 많은 요소로 구성됩니다. 맨 아래에는 Hadoop 클러스터의 모든 스토리지 노드에 파일을 저장하는 HDFS(Hadoop 분산 파일 시스템)가 있습니다. HDFS의 상위 계층은 JobTracker와 TaskTracker로 구성된 MapReduce 엔진입니다. Hadoop 분산 컴퓨팅 플랫폼의 핵심 분산 파일 시스템 HDFS 및 MapReduce 처리는 물론 데이터웨어 하우스 도구 Hive 및 분산 데이터베이스 Hbase의 도입을 통해 기본적으로 Hadoop 분산 플랫폼의 모든 기술 핵심을 포괄합니다.

더 많은 관련 지식을 보려면 PHP 중국어 웹사이트를 방문하세요!

위 내용은 hadoop의 핵심은 분산 파일 시스템 hdfs이고 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.