Le Big Data fait référence à un ensemble de données qui ne peuvent pas être capturées, gérées et traitées avec des outils logiciels conventionnels dans un certain laps de temps. Elles nécessitent de nouveaux modèles de traitement pour disposer d'un pouvoir décisionnel plus fort, d'une découverte d'informations et d'une optimisation des processus. capacités. Des actifs informationnels massifs, à forte croissance et diversifiés. Caractéristiques du Big Data : 1. Une énorme quantité de données ; 2. Des formes de données diverses et un large éventail de sources de données déterminent la diversité des formes de Big Data ; 3. Une vitesse élevée, c'est-à-dire une croissance rapide des données et un traitement rapide ; densité 5. Valeur commerciale élevée.
L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.
Qu'est-ce que le big data
Le Big data (big data), terme de l'industrie informatique, fait référence à l'incapacité d'utiliser des logiciels conventionnels au sein d'un certaine plage de temps La collecte de données capturées, gérées et traitées par les outils est un actif d'information massif, à forte croissance et diversifié qui nécessite de nouveaux modèles de traitement pour avoir un pouvoir de décision plus fort, des capacités de découverte d'informations et d'optimisation des processus.
Dans « L'ère du Big Data » écrit par Victor Meier-Schoenberg et Kenneth Cukier, le big data fait référence à l'utilisation de toutes les données au lieu de raccourcis tels que l'analyse aléatoire (enquête par échantillonnage). Les caractéristiques 5V du big data (proposées par IBM) : Volume (capacité), Vélocité (haute vitesse), Variété (diversité), Valeur (faible densité de valeurs) et Véracité (authenticité).
Caractéristiques
Volume : La taille des données détermine la valeur et les informations potentielles des données considérées
Quelles sont les caractéristiques du big data
1. Le volume de données est énormeAvec Internet Avec le développement de l'industrie, de nombreuses données sur le comportement des utilisateurs sur le réseau sont générées et accumulées dans les opérations quotidiennes. Par exemple, les plateformes sociales de commerce électronique génèrent des commandes chaque jour, des publications, des commentaires et de courtes vidéos publiées par diverses courtes vidéos, forums et communautés, des e-mails envoyés chaque jour et des images, vidéos et musiques téléchargées, etc., l'ampleur des données générées. par d'innombrables personnes C'est très énorme et le volume de données a déjà atteint le niveau PB. Si des données à si grande échelle veulent être traitées, analysées et comptées, elles doivent avoir une capacité suffisamment grande. L’une des caractéristiques du Big Data est donc son énorme volume. 2. Divers formulaires de données Un large éventail de sources de données détermine la diversité des formulaires Big Data. Toute forme de données peut être utile. Actuellement, la plus largement utilisée est le système de recommandation, tel que Taobao, NetEase Cloud Music, Toutiao, etc. Ces plateformes analyseront les données de journal des utilisateurs pour recommander davantage les choses que les utilisateurs aiment. Les données de journal sont des données clairement structurées, et certaines données ne le sont pas non plus, telles que des images, des audios, des vidéos, etc. Ces données ont de faibles relations causales et nécessitent une annotation manuelle. 3. Haute vitesse La grande vitesse du Big Data fait référence à la croissance rapide des données et à leur traitement rapide. Chaque jour, les données provenant de tous les horizons augmentent de façon exponentielle. Dans de nombreux scénarios, les données sont sensibles au facteur temps. Par exemple, les moteurs de recherche doivent présenter les données dont les utilisateurs ont besoin en quelques secondes. Lorsque les entreprises ou les systèmes sont confrontés à des quantités de données en croissance rapide, ils doivent les traiter à grande vitesse et réagir rapidement. 4. Faible densité de valeursLa faible densité de valeurs du Big Data signifie que parmi les sources de données massives, il existe très peu de données vraiment précieuses, et une grande partie des données peuvent être fausses. incomplet et ne peut être utilisé. D'une manière générale, la densité des données précieuses dans le total des données est très faible et affiner les données, c'est comme surfer sur le sable. 5. Haute valeur commercialePar rapport aux petites données traditionnelles, la plus grande valeur du Big Data est d'extraire des informations sur les tendances futures à partir d'une grande quantité de données non pertinentes de divers types. La prédiction du modèle analyse des données précieuses et, grâce à une analyse approfondie utilisant des méthodes d'apprentissage automatique, des méthodes d'intelligence artificielle ou des méthodes d'exploration de données, de nouvelles règles et de nouvelles connaissances sont découvertes et appliquées à divers domaines tels que l'agriculture, la finance et les soins médicaux. afin d'améliorer à terme la gouvernance sociale, d'améliorer l'efficacité de la production, de promouvoir l'efficacité de la recherche scientifique et de réaliser sa valeur commerciale. Recommandé : "Vidéo de programmation"
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!