빅데이터에서 무엇을 배울 것인가-일반적인 문제-php.cn

집

일반적인 문제

빅데이터에서 무엇을 배울 것인가

王林

Apr 29, 2020 am 11:47 AM

빅데이터

빅데이터에서 무엇을 배울 것인가

1. Java 프로그래밍

Java 프로그래밍은 Hadoop, Spark, mapreduce 등 빅데이터의 많은 기술이 Java로 작성됩니다. 따라서 빅데이터를 배우고 싶다면 뭐, 자바 프로그래밍은 꼭 필요한 스킬이잖아요!

(추천 학습: java 입문 프로그램)

2. Linux 운영 및 유지 관리

기업용 빅데이터 개발은 Linux 운영 체제에서 완료되는 경우가 많습니다. 따라서 빅데이터 관련 작업을 수행하려는 경우 Linux 시스템 작동 방법 및 관련 명령을 마스터해야 합니다.

3. Hadoop

Hadoop은 대용량 데이터의 분산 처리를 수행할 수 있는 소프트웨어 프레임워크입니다. HDFS는 대용량 데이터에 대한 저장을 제공하고 MapReduce는 대용량 데이터에 대한 계산을 제공합니다. 빅데이터 개발을 위한 필수 프레임워크 기술입니다.

4. Zookeeper

ZooKeeper는 Google의 Chubby를 오픈소스로 구현한 것이며 Hadoop 및 Hbase의 중요한 구성 요소입니다. 분산 애플리케이션에 일관된 서비스를 제공하는 소프트웨어입니다. 제공되는 기능에는 구성 유지 관리, 도메인 이름 서비스, 분산 동기화, 그룹 서비스 등이 있습니다.

5. Hive

hive는 구조화된 데이터 파일을 데이터베이스 테이블에 매핑하고 간단한 SQL 쿼리 기능을 제공할 수 있는 데이터 웨어하우스 도구입니다. 데이터웨어 하우스의 통계 분석.

6.Hbase

하둡 생태계의 NOSQL 데이터베이스로, 해당 데이터는 키와 값의 형태로 저장되며, 키는 고유하므로 데이터 중복 제거에 사용할 수 있습니다. MYSQL을 사용하면 저장할 수 있는 데이터의 양이 훨씬 더 많습니다

7. Kafka

Kafka는 처리량이 높은 분산 게시-구독 메시징 시스템입니다. Hadoop의 병렬 로딩 메커니즘은 온라인과 오프라인 메시지 처리를 통합하고 클러스터를 통해 실시간 메시지를 제공합니다.

8. Spark

Spark는 대규모 데이터 처리를 위해 설계된 빠르고 일반적인 컴퓨팅 엔진이지만 MapReduce와 달리 작업의 중간 출력 결과를 메모리에 저장할 수 있으므로 더 이상 HDFS를 읽고 쓸 필요가 없으므로 Spark는 데이터 마이닝 및 기계 학습과 같이 반복이 필요한 MapReduce 알고리즘에 더 적합합니다.

위 내용은 빅데이터에서 무엇을 배울 것인가의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는