>  기사  >  Java  >  자바 빅데이터에 대해 배울 점

자바 빅데이터에 대해 배울 점

silencement
silencement원래의
2019-05-29 17:06:506416검색

자바 빅데이터에 대해 배울 점

Java 프로그래머의 경우 주류 빅데이터 플랫폼 hadoop이 Java를 기반으로 개발되었기 때문에 Java 빅데이터 프로그래머는 보다 원활한 언어 환경을 갖습니다. 또한 많은 빅데이터 기반 애플리케이션 프레임워크도 Java 기반이므로 많은 경우에 사용됩니다. 애플리케이션 Java 언어를 마스터하면 빅 데이터 프로젝트에서 확실한 이점을 얻을 수 있습니다.

물론, hadoop의 핵심 가치는 분산 파일 시스템과 분산 컴퓨팅 엔진을 제공하는 것입니다. 대부분의 회사에서는 이 엔진을 수정할 필요가 없습니다. 이때 프로그래밍에 익숙해지는 것 외에도 일반적으로 데이터 처리 및 데이터 마이닝에 대한 지식도 배워야 합니다. 특히 데이터 마이닝 엔지니어로 성장하는 경우에는 더 많은 알고리즘 관련 지식을 습득해야 합니다.

데이터 마이닝 엔지니어의 경우 프로그래밍 도구도 마스터해야 하지만 대부분의 경우 Hadoop을 플랫폼 및 도구로 사용하며, 제공되는 인터페이스의 도움으로 데이터 처리 및 데이터 마이닝에 다양한 스크립팅 언어가 사용됩니다. 이 플랫폼과 도구. 따라서 데이터 마이닝 엔지니어링 방향으로 가려면 scala, Spark-mllib 등과 같은 분산 프로그래밍 언어에 능숙한 것이 더 중요할 수 있습니다.

Java 빅 데이터 엔지니어를 위한 학습 로드맵:

1단계: 분산 컴퓨팅 프레임워크

hadoop을 마스터하고 분산 컴퓨팅 프레임워크를 활성화하고, 파일 시스템, 메시지 대기열 및 Nosql 데이터베이스를 이해하고, hadoop과 같은 관련 구성 요소를 학습합니다. MR, Spark, hive, hbase, redies, kafka 등

2단계: 알고리즘 및 도구

분류, 클러스터링, 연관 규칙, 회귀, 결정 트리, 신경망과 같은 다양한 데이터 마이닝 알고리즘을 이해하는 방법을 알아보세요. 네트워크 잠깐만요, 데이터 마이닝 프로그래밍 도구인 Python이나 Scala에 능숙해지세요. 현재 주류 플랫폼과 프레임워크에서는 Hadoop의 Mahout 및 Spark의 Mllib와 같은 알고리즘 라이브러리를 제공하고 있습니다. 또한 이러한 인터페이스와 스크립팅 언어를 학습하여 이러한 알고리즘을 학습할 수도 있습니다.

3단계: 수학

보충 수학 지식: 고급 수학, 확률 이론 및 선 생성

4단계: 프로젝트 실습

1) 오픈 소스 프로젝트: tensorflow: Google의 오픈 소스 라이브러리, 이미 40,000개가 있습니다. 멀티스타, 참 대단하다, 모바일 기기 지원

2) 데이터 대회 참가

3) 기업 인턴십을 통해 프로젝트 경험 쌓기

빅데이터 개발과 운영, 유지보수만 한다면 2단계는 생략하고 세 번째 단계, 데이터 마이닝을 위해 기존 알고리즘을 적용하는 데 중점을 두는 경우 먼저 세 번째 단계를 건너뛸 수 있습니다.

위 내용은 자바 빅데이터에 대해 배울 점의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.