Maison  >  Article  >  Opération et maintenance  >  Qu’est-ce qu’Apache Hadoop ?

Qu’est-ce qu’Apache Hadoop ?

藏色散人
藏色散人original
2019-06-17 11:57:273936parcourir

Apache Hadoop est un framework permettant d'exécuter des applications sur de grands clusters construits sur du matériel à usage général. Il implémente le paradigme de programmation Map/Reduce, dans lequel les tâches informatiques sont divisées en petits morceaux (plusieurs fois) et exécutées sur différents nœuds. En outre, il fournit également un système de fichiers distribués (HDFS), dans lequel les données sont stockées sur des nœuds informatiques pour fournir une bande passante globale extrêmement élevée entre les centres de données.

Qu’est-ce qu’Apache Hadoop ?

Introduction au framework Apache Hadoop

De nombreux fournisseurs qui fournissent des services Big Data à Apache Hadoop rivalisent définitivement pour faire affaire avec les entreprises . Après tout, le Big Data Apache Hadoop ne constitue pas la plus petite collection de données, mais le Big Data Apache Hadoop doit tirer pleinement parti de la gestion des données autant que possible. Si vous recherchez une définition du déploiement d'Apache Hadoop pour le Big Data, ce n'est pas la définition complète d'Apache Hadoop. Vous avez besoin d’une infrastructure de centre de données Apache Hadoop en pleine croissance pour répondre à toutes ces données croissantes.

Ce boom du Big Data a réellement commencé avec le système de fichiers distribué Apache Hadoop, ouvrant la voie à l'ère de l'analyse massive des données Apache Hadoop basée sur une mise à l'échelle rentable des serveurs utilisant des clusters de disques locaux relativement bon marché. Quelle que soit la rapidité avec laquelle l'entreprise développe Apache Hadoop et les solutions Big Data liées à Apache Hadoop, Apache Hadoop peut garantir une analyse continue de diverses données brutes.

Le problème est qu'une fois que vous souhaitez démarrer avec le Big Data Apache Hadoop, vous constaterez que les projets de données Apache Hadoop traditionnels, y compris les problèmes familiers de gestion des données d'entreprise, réapparaîtront, comme la sécurité d'Apache Hadoop. données. Fiabilité, performances et comment protéger les données.

Bien qu'Apache Hadoop HDFS soit devenu mature, il existe encore de nombreuses lacunes pour répondre aux besoins des entreprises. Il s'avère que lorsqu'il s'agit de collecte de données de production de produits pour Apache Hadoop Big Data, les produits présents sur ces clusters de stockage ne fournissent pas nécessairement la comptabilité la plus économique.

Le point le plus critique ici est en fait la façon dont les grandes entreprises revitalisent le Big Data Apache Hadoop. Bien entendu, nous ne voulons pas simplement copier, déplacer et sauvegarder des copies de données Big Data Apache Hadoop. La copie de Big Data Apache Hadoop est un gros travail. Nous devons gérer les bases de données Apache Hadoop avec encore plus d'exigences en matière de sécurité et de prudence, donc ne conservez pas autant de détails Apache Hadoop que de petits détails. Si nous devions baser nos processus métier critiques sur le nouveau magasin de Big Data Apache Hadoop, nous aurions besoin de toute sa résilience opérationnelle et de ses hautes performances.

Pour plus de connaissances sur Apache, veuillez visiter la colonne Tutoriel d'utilisation d'Apache !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Que fait Apache ?Article suivant:Que fait Apache ?