Cet article vous guide pour installer et tester Apache Hadoop sur votre système Debian. Les étapes suivantes fourniront une description détaillée du processus de configuration et des méthodes de vérification.
Étape 1: Installer Java
Assurez-vous que le système a installé Java 8 ou supérieur. Installez OpenJDK 8 en utilisant la commande suivante:
Mise à jour Sudo Apt sudo apt install openjdk-8-jdk
Vérifiez l'installation:
Java-Version
Étape 2: Télécharger et décompresser Hadoop
Téléchargez la dernière version de Hadoop à partir du site officiel d'Apache Hadoop et déziptez-le dans le répertoire spécifié (par exemple /usr/local/hadoop
):
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz TAR -XZVF HADOOP-3.3.1.tar.gz -c / usr / local / hadoop `` `(Veuillez remplacer` Hadoop-3.3.1` par le numéro de version réel) ** Étape 3: Configurer les variables d'environnement ** Modifiez le fichier `~ / .bashrc` et ajoutez les variables d'environnement suivantes: `` `bash exporter hadoop_home = / usr / local / hadoop Export Path = $ Path: $ hadoop_home / bin: $ hadoop_home / sbin
Faire prendre effet les modifications:
Source ~ / .Bashrc
Étape 4: Configurer le fichier de configuration de Hadoop
Modifiez le fichier de configuration dans le répertoire Hadoop:
- core-site.xml :
<configuration> <property> <name>Fs.defaultfs</name> <value>hdfs: // namenode: 9000</value> </property> </configuration>
- hdfs-site.xml :
<configuration> <property> <name>dfs.réplication</name> <value>3</value> </property> <property> <name>dfs.nameNode.name.dir</name> <value>/ usr / local / hadoop / dfs / nom</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/ usr / local / hadoop / dfs / data</value> </property> </configuration>
- mapred-site.xml :
<configuration> <property> <name>mapreduce.framework.name</name> <value>fil</value> </property> </configuration>
- yarn-site.xml :
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>MapReduce_Shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.shufflehandler</value> </property> </configuration>
Étape 5: Format HDFS
Sur le nœud NameNode, exécutez la commande suivante pour formater HDFS:
hdfs namenode -format
Étape 6: Démarrez le service Hadoop
Démarrer NameNode et Datanode sur le nœud NameNode:
start-dfs.sh
Démarrez le fil sur le nœud ResourceManager:
start-yarn.sh
Étape 7: Test de mode local
Passez à l'utilisateur de Hadoop:
su - Hadoop
Créer des répertoires et des fichiers d'entrée:
mkdir ~ / entrée vi ~ / input / data.txt
Entrez les données de test (par exemple "Hello World", "Hello Hadoop"), enregistrez et sortez.
Exemple d'exemple de compte:
hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*..jar wordCount ~ / input / data.txt ~ / sortie `` `(Veuillez l'ajuster en fonction du nom du fichier de package JAR réel) Voir les résultats: `` `bash ls ~ / sortie Cat ~ / Output / Part-R-00000
La sortie correcte indique que le mode local Hadoop s'exécute avec succès. Veuillez noter que les étapes ci-dessus supposent que vous testez dans un environnement autonome. Pour les environnements de cluster, des modifications de configuration correspondantes sont nécessaires. Assurez-vous de vous référer à la documentation officielle de Hadoop pour des informations de configuration plus détaillées et plus détaillées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Les cinq composants principaux du système d'exploitation Linux sont: 1. Kernel, 2. Bibliothèques système, 3. Tools System, 4. System Services, 5. File System. Ces composants fonctionnent ensemble pour assurer le fonctionnement stable et efficace du système et forment ensemble un système d'exploitation puissant et flexible.

Les cinq éléments principaux de Linux sont: 1. Kernel, 2. Interface de ligne de commande, 3. Système de fichiers, 4. Gestion des packages, 5. Communauté et open source. Ensemble, ces éléments définissent la nature et la fonctionnalité de Linux.

La gestion et la sécurité des utilisateurs de Linux peuvent être réalisées via les étapes suivantes: 1. Créez des utilisateurs et des groupes, à l'aide de commandes telles que SudouserAdd-M-Gdevelopers-S / Bin / Bashjohn. 2. 3. Vérifiez et corrigez les erreurs courantes, les paramètres du répertoire personnel et du shell. 4. Mettre en œuvre les meilleures pratiques telles que les politiques cryptographiques solides, les audits réguliers et le principe de l'autorité minimale. 5. Optimiser les performances, utiliser Sudo et ajuster la configuration du module PAM. Grâce à ces méthodes, les utilisateurs peuvent être gérés efficacement et la sécurité du système peut être améliorée.

Les opérations principales du système de fichiers Linux et de la gestion des processus incluent la gestion du système de fichiers et le contrôle des processus. 1) Les opérations du système de fichiers incluent la création, la suppression, la copie et le déplacement des fichiers ou des répertoires, à l'aide de commandes telles que MKDIR, RMDIR, CP et MV. 2) La gestion des processus implique le démarrage, la surveillance et la mort des processus, en utilisant des commandes telles que ./My_Script.sh&, top et tuer.

Les scripts shell sont des outils puissants pour l'exécution automatisée des commandes dans les systèmes Linux. 1) Le script shell exécute les commandes ligne par ligne via l'interprète pour traiter la substitution variable et le jugement conditionnel. 2) L'utilisation de base comprend les opérations de sauvegarde, telles que l'utilisation de la commande TAR pour sauvegarder le répertoire. 3) L'utilisation avancée implique l'utilisation des fonctions et des instructions de cas pour gérer les services. 4) Les compétences de débogage incluent l'utilisation de SET-X pour activer le mode de débogage et Set-E pour quitter la commande échoue. 5) L'optimisation des performances est recommandée pour éviter les sous-coquilles, les tableaux d'utilisation et les boucles d'optimisation.

Linux est un système d'exploitation multi-utilisateur multi-utilisateurs basé sur UNIX qui met l'accent sur la simplicité, la modularité et l'ouverture. Ses fonctions principales incluent: Système de fichiers: organisé dans une structure d'arbre, prend en charge plusieurs systèmes de fichiers tels que Ext4, XFS, BTRFS et utiliser DF-T pour afficher les types de systèmes de fichiers. Gestion du processus: afficher le processus via la commande PS, gérer le processus à l'aide de PID, impliquant des paramètres de priorité et un traitement du signal. Configuration du réseau: paramètre flexible des adresses IP et gestion des services réseau, et utilisez SudoipAddradd pour configurer IP. Ces fonctionnalités sont appliquées dans des opérations réelles via des commandes de base et une automatisation avancée des scripts, l'amélioration de l'efficacité et la réduction des erreurs.

Les méthodes pour entrer le mode de maintenance Linux incluent: 1. Modifier le fichier de configuration de Grub, ajouter des paramètres "single" ou "1" et mettre à jour la configuration de GRUB; 2. Modifiez les paramètres de démarrage dans le menu GRUB, ajoutez "Single" ou "1". Le mode de maintenance de sortie ne nécessite que le redémarrage du système. Avec ces étapes, vous pouvez rapidement saisir le mode de maintenance en cas de besoin et sortir en toute sécurité, en garantissant la stabilité et la sécurité du système.

Les composants principaux de Linux incluent le noyau, le shell, le système de fichiers, la gestion des processus et la gestion de la mémoire. 1) Ressources du système de gestion du noyau, 2) Shell fournit une interface d'interaction utilisateur, 3) le système de fichiers prend en charge plusieurs formats, 4) la gestion des processus est implémentée via des appels système tels que Fork et 5) La gestion de la mémoire utilise la technologie de mémoire virtuelle.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

SublimeText3 version anglaise
Recommandé : version Win, prend en charge les invites de code !

PhpStorm version Mac
Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.

Version Mac de WebStorm
Outils de développement JavaScript utiles
