Maison >Problème commun >Quelles sont les caractéristiques 4V du big data ?
Les caractéristiques 4V du Big Data sont : 1. Le volume avec le développement rapide des technologies de l'information, les données commencent à croître de manière explosive. 2. Vitesse. 3. Variété ; se reflète principalement dans plusieurs sources de données, plusieurs types de données et une forte corrélation entre les données ;
L'environnement d'exploitation de cet article : système Windows 10, ordinateur thinkpad t480.
Le Big Data, terme de l'industrie informatique, fait référence à un ensemble de données qui ne peuvent pas être capturées, gérées et traitées dans un certain laps de temps à l'aide d'outils logiciels conventionnels. Elles nécessitent de nouveaux modèles de traitement pour permettre une prise de décision plus solide. Des actifs informationnels massifs, à forte croissance et diversifiés avec des capacités puissantes, des informations et des capacités d'optimisation des processus.
4v Caractéristiques du Big Data
Caractéristiques du Big Data, dans "The Era of Big Data" écrit par Viktor Mayer-Schoenberg et Kenneth Skye Il est proposé que le Les caractéristiques 4V du Big Data sont : volume, vitesse, variété et valeur.
(1) Échelle
Avec le développement rapide des technologies de l'information, les données ont commencé à croître de manière explosive. Les données du Big Data ne se mesurent plus en gigaoctets ou en téraoctets, mais en PB (1 000 téraoctets), EB (1 million de téraoctets) ou ZB (1 milliard de téraoctets).
(2) Diversité
La diversité se reflète principalement dans trois aspects : plusieurs sources de données, plusieurs types de données et une forte corrélation entre les données.
① Il existe de nombreuses sources de données. Les données traditionnelles auxquelles les entreprises sont confrontées sont principalement des données de transaction. Le développement d'Internet et de l'Internet des objets a apporté des données provenant de sources multiples telles que les sites de réseaux sociaux et les capteurs.
Étant donné que les données proviennent de différents systèmes d'application et de différents appareils, la diversité des formes de Big Data est déterminée. Elles peuvent être grossièrement divisées en trois catégories : premièrement, les données structurées, telles que les données du système financier, les données du système de gestion de l'information, les données du système médical, etc., qui se caractérisent par de fortes relations causales entre les données ; deuxièmement, les données non structurées, telles que les vidéos ; , images, audio, etc., qui se caractérisent par l'absence de relation causale entre les données ; des données tierces, semi-structurées, telles que les documents HTML, les e-mails, les pages Web, etc., se caractérisent par une faible relation causale entre les données.
②Il existe de nombreux types de données, et ce sont principalement des données non structurées. Dans les entreprises traditionnelles, les données sont stockées dans des tables. 70 à 85 % des données du Big Data sont des données non structurées et semi-structurées telles que des images, des audios, des vidéos, des journaux Web, des informations sur les liens, etc.
③ Les données sont fortement corrélées et interagissent fréquemment les unes avec les autres. Par exemple, les photos et les journaux téléchargés par les touristes pendant leurs voyages sont étroitement liés à leur emplacement, leur itinéraire et d'autres informations.
(3) Haute vitesse
Il s'agit de la caractéristique la plus importante du Big Data qui le distingue de l'exploration de données traditionnelle. La différence importante entre les mégadonnées et les données massives réside dans deux aspects : d'une part, l'échelle des données des mégadonnées est plus grande, d'autre part, les mégadonnées ont des exigences plus strictes en matière de vitesse de réponse du traitement des données ; L'analyse en temps réel au lieu de l'analyse par lots, la saisie, le traitement et la suppression des données sont effectués immédiatement, presque sans délai. Le taux de croissance et la vitesse de traitement des données sont des manifestations importantes de la vitesse élevée du Big Data.
(4) Valeur
Bien que les entreprises disposent d'une grande quantité de données, seule une très petite partie de celles-ci exerce de la valeur. La valeur cachée derrière le Big Data est énorme. Étant donné que la proportion de données précieuses dans le Big Data est très faible, la valeur réelle du Big Data se reflète dans une grande quantité de données non pertinentes de divers types. Extraire des données précieuses pour prédire et analyser les tendances et modèles futurs, et mener une analyse approfondie grâce à des méthodes d'apprentissage automatique, des méthodes d'intelligence artificielle ou des méthodes d'exploration de données, et les appliquer à divers domaines tels que l'agriculture, la finance et les soins médicaux, dans afin de créer une plus grande valeur.
Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!