BigData 빅데이터 운영 및 유지관리-리눅스 운영 및 유지 관리-php.cn

집

운영 및 유지보수

리눅스 운영 및 유지 관리

BigData 빅데이터 운영 및 유지관리

重铸

Jul 23, 2020 pm 05:24 PM

빅데이터 운영 및 유지보수

1.HDFS분산 파일 시스템 운영 및 유지보수

1.in HDFS 루트 디렉터리에 재귀 생성 파일 시스템 디렉토리 "1daoyun/file" , 첨부 파일의 BigDataSkills.txt 파일을 1daoyun/file 디렉토리에 업로드하고 관련 명령을 사용하여 파일을 확인하세요 시스템에서 1daoyun/file 디렉토리의 파일 목록 정보입니다. 2.

HDFS

파일 시스템의 루트 디렉터리에 재귀 디렉터리

"1daoyun/file"

을 만들고 첨부된 BigDataSkills.txt 를 업로드하세요. 파일을 1daoyun/ file 디렉터리를 탐색하고 HDFS File Systemcheck 도구를 사용하여 파일이 손상되었는지 확인하세요. hadoop fs -mkdir -p /1daoyun/filehadoop fs -put BigDataSkills.txt/1daoyun/filehadoop fsck /1daoyun/file/BigDataSkills.txt 3.

HDFS

파일 시스템의 루트 디렉터리에 재귀 디렉터리

"1daoyun/file"

을 만들고 첨부된 BigDataSkills.txt 파일을 다음 위치에 업로드하세요. 1daoyun / 파일 디렉터리, 업로드 프로세스는 HDFS 파일 시스템의 bigdataskills.txt 파일을 2으로 지정하고 FSCK 을 사용합니다. 저장공간 확인 및 보관 블록의 복사본 수.

hadoop fs -mkdir -p /1daoyun/file

hadoop fs -D dfs.replication=2 -put BigDataSkills.txt /1daoyun/file

hadoop fsck /1daoyun/file/BigDataSkills.txt

4.HDFS 파일 시스템의 루트 디렉토리에 /apps 파일 디렉토리가 있습니다. 이 디렉토리의 스냅샷 생성 기능을 활성화하고 스냅샷을 생성해야 합니다. Snapshot 이름은 apps_1daoyun이며, 를 사용하면 관련 명령을 사용하여 스냅샷 파일의 목록 정보를 볼 수 있습니다.

hadoop dfsadmin -allowSnapshot /apps

hadoop fs -createSnapshot /apps apps_1daoyun

hadoop fs -ls /apps/.snapshot

5. 당 하둡 클러스터가 시작되면 먼저 안전 모드로 들어갑니다. 이 모드는 기본적으로 30 초 후에 종료됩니다. 시스템이 안전 모드에 있으면 HDFS 파일 시스템은 읽기만 가능하며 쓰기, 수정, 삭제 등의 작업을 수행할 수 없습니다. 이제 Hadoop 클러스터를 유지 관리해야 한다고 가정합니다. 클러스터를 안전 모드로 전환하고 상태를 확인해야 합니다.

hdfs dfsadmin -safemode enter

hdfs dfsadmin -safemode get

6.운영자가 실수로 파일을 삭제하는 것을 방지하기 위해 HDFS 파일 시스템은 다음 기능을 제공합니다. 하지만 정크 파일이 너무 많으면 저장 공간을 많이 차지하게 됩니다. Xiandian 빅 데이터 플랫폼의 WEB interface이 HDFS 파일 시스템 휴지통에 있는 파일을 완전히 삭제하는 데 필요한 기간은 7 일입니다. Advancedcore-sitefs.trash.interval: 10080

BigData 빅데이터 운영 및 유지관리

7.운영자가 실수로 파일을 삭제하는 것을 방지하기 위해 HDFS 파일 시스템에서는 휴지통 기능을 제공하지만 정크 파일이 너무 많으면 저장 공간을 많이 차지하게 됩니다. 해당 구성 파일과 매개변수 정보를 수정하고 휴지통 기능을 끄려면 Linux Shell 에서 "vi" 명령을 사용해야 합니다. 완료 후 해당 서비스를 다시 시작하세요. Advancedcore-sitefs.trash.interval: 0vi /etc/hadoop/2.4.3.0-227/0/core-site.xml

erty>

sbin/stop-dfs.sh

sbin/start-dfs.sh

8.Hadoop 클러스터의 호스트에 가동 중지 시간이 발생하거나

이러한 문제가 발생하면

HDFS

파일 시스템의 데이터 파일이 필연적으로 손상되거나 손실됩니다.

파일의 신뢰성을 보장합니다. 시스템에서는 이제 고급 빅데이터 플랫폼을 사용해야 합니다

WEB

interface

는 클러스터의 중복 복제 계수를 5로 수정합니다. 일반복제 차단5

9.Hadoop 경우에 따라 클러스터의 호스트에 가동 중지 시간이 발생하거나 시스템이 손상될 수 있습니다. 이러한 문제가 발생하면 HDFS 파일 시스템의 데이터 파일이 필연적으로 손상되거나 손상됩니다. 손실이 발생하면 HDFS 파일 시스템의 안정성을 보장하려면 클러스터의 중복 복제 요소를 Linux Shell 에서 사용되는 5, 으로 수정해야 합니다. "vi"명령어를 사용하여 해당 구성 파일 및 매개변수 정보를 수정합니다. 완료 후 해당 서비스를 다시 시작합니다.

BigData 빅데이터 운영 및 유지관리 또는

vi/etc/hadoop/2.4.3.0-227/0/hdfs-site.xml

>dfs.복제< ;/이름>

| sh --config /usr/hdp/current/hadoop-client/conf 중지 {namenode/datenode}

/usr/ hdp/current/hadoop-client/sbin/hadoop-daemon.sh -- config /usr/hdp/current/hadoop-client/conf start {namenode/datenode}

10.

명령을 사용하여 확인하세요.

hdfs

파일 시스템의

/tmp

디렉토리 수, 파일 수 및 파일의 총 크기

. hadoop fs -count /tmp2.MapREDUCE 사례 질문

1.클러스터 노드 /usr/hdp/2.4.3.0-227/hadoop-mapreduce/ 디렉터리에 JAR 패키지 hadoop이 있습니다. -맵리듀스 -examples.jar. PI 프로그램을 JAR 패키지에서 실행하여 piπ의 대략적인 값을 계산하려면 5번 Map 작업을 실행해야 합니다. The 작업의 던지기 횟수는 5입니다. cd

/usr/hdp/2.4.3.0-227/hadoop-mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar 파이 5 5

BigData 빅데이터 운영 및 유지관리 2.

클러스터 노드 /usr/hdp/2.4.3.0-227/hadoop-mapreduce/ 디렉토리에 JAR이 있습니다 가방 hadoop-mapreduce-examples.jar. JAR 패키지의 wordcount 프로그램을 실행하여 /1daoyun/file/BigDataSkills.txt 파일에서 단어 계산을 수행하고 연산 결과를 /1daoyun/output 에 출력합니다. Directory 에서는 관련 명령을 사용하여 단어 수 결과를 쿼리합니다. hadoop jar/usr/hdp/2.4.3.0-227/hadoop-mapreduce/hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar 단어 수 /1daoyun/file/BigDataSkills.txt /1daoyun/ 출력

3.클러스터 노드 /usr/hdp/2.4.3.0-227/hadoop-mapreduce/ 디렉터리에 JAR 패키지 hadoop이 있습니다. -맵리듀스 -examples.jar. JAR 패키지의 sudoku 프로그램을 실행하여 아래 표의 스도쿠 문제 결과를 계산해 보세요. .

BigData 빅데이터 운영 및 유지관리

cat puzzle1.dta

hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar sudoku /root/puzzle1.dta

4 . 클러스터 노드 /usr/hdp/2.4.3.0-227/hadoop-mapreduce/ 디렉터리에 JAR 패키지 hadoop-mapreduce-examples.jar이 있습니다. . JAR 패키지에서 grep 프로그램을 실행하여 "Hadoop" 이 파일 시스템 /1daoyun/file/BigDataSkills.txt 에 나타나는 횟수를 계산합니다. 는 완료 후 통계결과 정보를 조회해 보세요.

hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar grep /1daoyun/file/BigDataSkills.txt /output hadoop

위 내용은 BigData 빅데이터 운영 및 유지관리의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Debian이 Hadoop 데이터 처리 속도를 향상시키는 방법Apr 13, 2025 am 11:54 AM

이 기사에서는 데비안 시스템에서 Hadoop 데이터 처리 효율성을 향상시키는 방법에 대해 설명합니다. 최적화 전략에는 하드웨어 업그레이드, 운영 체제 매개 변수 조정, Hadoop 구성 수정 및 효율적인 알고리즘 및 도구 사용이 포함됩니다. 1. 하드웨어 리소스 강화는 모든 노드에 일관된 하드웨어 구성, 특히 CPU, 메모리 및 네트워크 장비 성능에주의를 기울일 수 있도록합니다. 전반적인 처리 속도를 향상시키기 위해서는 고성능 하드웨어 구성 요소를 선택하는 것이 필수적입니다. 2. 운영 체제 조정 파일 설명 자 및 네트워크 연결 : /etc/security/limits.conf 파일을 수정하여 파일 설명자의 상한을 늘리고 동시에 시스템에 의해 열 수 있습니다. JVM 매개 변수 조정 : Hadoop-env.sh 파일에서 조정

데비안 syslog를 배우는 방법Apr 13, 2025 am 11:51 AM

이 안내서는 데비안 시스템에서 syslog를 사용하는 방법을 배우도록 안내합니다. Syslog는 로깅 시스템 및 응용 프로그램 로그 메시지를위한 Linux 시스템의 핵심 서비스입니다. 관리자가 시스템 활동을 모니터링하고 분석하여 문제를 신속하게 식별하고 해결하는 데 도움이됩니다. 1. syslog에 대한 기본 지식 syslog의 핵심 기능에는 다음이 포함됩니다. 로그 메시지 중앙 수집 및 관리; 다중 로그 출력 형식 및 대상 위치 (예 : 파일 또는 네트워크) 지원; 실시간 로그보기 및 필터링 기능 제공. 2. Syslog 설치 및 구성 (RSYSLOG 사용) Debian 시스템은 기본적으로 RSYSLOG를 사용합니다. 다음 명령으로 설치할 수 있습니다 : sudoaptupdatesud

데비안에서 Hadoop 버전을 선택하는 방법Apr 13, 2025 am 11:48 AM

데비안 시스템에 적합한 Hadoop 버전을 선택할 때는 다음과 같은 주요 요소를 고려해야합니다. 1. 안정성 및 장기 지원 : 안정성과 보안을 추구하는 사용자의 경우 Debian11 (Bullseye)과 같은 데비안 안정 버전을 선택하는 것이 좋습니다. 이 버전은 완전히 테스트되었으며 최대 5 년의 지원주기가있어 시스템의 안정적인 작동을 보장 할 수 있습니다. 2. 패키지 업데이트 속도 : 최신 Hadoop 기능 및 기능을 사용해야하는 경우 Debian의 불안정한 버전 (SID)을 고려할 수 있습니다. 그러나 불안정한 버전에는 호환성 문제와 안정성 위험이있을 수 있습니다. 3. 커뮤니티 지원 및 자원 : 데비안은 풍부한 문서를 제공하고

Debian의 Tigervnc 공유 파일 메소드Apr 13, 2025 am 11:45 AM

이 기사에서는 Tigervnc를 사용하여 데비안 시스템에서 파일을 공유하는 방법에 대해 설명합니다. 먼저 tigervnc 서버를 설치 한 다음 구성해야합니다. 1. TigervNC 서버를 설치하고 터미널을 엽니 다. 소프트웨어 패키지 목록 업데이트 : sudoaptupdate tigervnc 서버를 설치하려면 : sudoaptinstalltigervnc-standalone-servertigervnc-common 2. VNC 서버 비밀번호를 설정하도록 tigervnc 서버 구성 : vncpasswd vnc 서버 : vncserver : 1-localhostno

데비안 메일 서버 방화벽 구성 팁Apr 13, 2025 am 11:42 AM

데비안 메일 서버의 방화벽 구성은 서버 보안을 보장하는 데 중요한 단계입니다. 다음은 iptables 및 방화구 사용을 포함하여 일반적으로 사용되는 여러 방화벽 구성 방법입니다. iptables를 사용하여 iptables를 설치하도록 방화벽을 구성하십시오 (아직 설치되지 않은 경우) : sudoapt-getupdatesudoapt-getinstalliptablesview 현재 iptables 규칙 : sudoiptables-l configuration

데비안 메일 서버 SSL 인증서 설치 방법Apr 13, 2025 am 11:39 AM

Debian Mail 서버에 SSL 인증서를 설치하는 단계는 다음과 같습니다. 1. OpenSSL 툴킷을 먼저 설치하십시오. 먼저 OpenSSL 툴킷이 이미 시스템에 설치되어 있는지 확인하십시오. 설치되지 않은 경우 다음 명령을 사용하여 설치할 수 있습니다. 개인 키 및 인증서 요청 생성 다음에 다음, OpenSSL을 사용하여 2048 비트 RSA 개인 키 및 인증서 요청 (CSR)을 생성합니다.

데비안 메일 서버 가상 호스트 구성 방법Apr 13, 2025 am 11:36 AM

Debian 시스템에서 메일 서버의 가상 호스트를 구성하려면 일반적으로 Apache가 웹 서버 기능에 주로 사용되기 때문에 Apache Httpserver가 아닌 Mail Server 소프트웨어 (예 : Postfix, Exim 등)를 설치하고 구성하는 것이 포함됩니다. 다음은 메일 서버 가상 호스트 구성을위한 기본 단계입니다. PostFix Mail Server 업데이트 시스템 패키지 설치 : SudoaptupDatesudoAptUpgrade PostFix 설치 : Sudoapt

데비안 메일 서버 DNS 설정 안내서Apr 13, 2025 am 11:33 AM

Debian Mail 서버의 DNS 설정을 구성하려면 다음 단계를 수행 할 수 있습니다. 네트워크 구성 파일 열기 : 텍스트 편집기 (예 : VI 또는 NANO)를 사용하여 네트워크 구성 파일/etc/네트워크/인터페이스를 엽니 다. Sudonano 등/네트워크/인터페이스 네트워크 인터페이스 구성을 찾으십시오. 구성 파일에서 수정할 네트워크 인터페이스를 찾으십시오. 일반적으로 이더넷 인터페이스의 구성은 IFETH0 블록에 있습니다.

See all articles