En parlant de big data, je pense que tout le monde a seulement entendu parler de ce concept, mais il n'y a pas de norme sur ce que c'est spécifiquement et comment le définir, car à notre avis, de nombreuses entreprises sont appelées sociétés de big data, et leur Les formulaires commerciaux sont Il en existe des centaines, mais ils ne sont pas faciles à comprendre, je suggère donc que nous comprenions le Big Data au sens littéral. Dans "L'ère du Big Data" écrit par Victor Mayer-Schoenberg et Kenneth Cukier, ils ont mentionné 4 aspects. du big data. Caractéristiques :
La première est que seul le volume de données atteint le niveau PB ou supérieur. être appelé big data. (Apprentissage recommandé : Tutoriel vidéo Python)
1 Po est égal à 1024 To, 1 To est égal à 1024 Go, puis 1 Po est égal à 1024*1024 Go de données.
Le deuxième est d'un excellent rapport qualité-prix.
Si vous disposez de plus de 1 Po de données Internet des 20 à 35 jeunes du pays, alors cela aura naturellement une valeur commerciale. Par exemple, en analysant ces données, nous pouvons connaître les loisirs. de ces personnes, puis guider la direction du développement des produits, etc.
Si nous disposons des données de millions de patients à travers le pays, nous pouvons prédire l'apparition de maladies en analysant ces données. Ce sont les valeurs du big data.
Le troisième est la diversité.
S'il n'y a qu'une seule donnée, alors les données n'ont aucune valeur. Par exemple, il n'y a qu'une seule donnée personnelle, ou une seule donnée soumise par un utilisateur. Ces données ne peuvent pas être appelées big data. c’est ce qu’on appelle le big data. Il doit également être diversifié.
Par exemple, parmi les internautes actuels, chacun a des caractéristiques différentes telles que l'âge, l'éducation, les loisirs, la personnalité, etc. C'est la diversité du big data. Bien sûr, si on l'étend à l'ensemble du pays, la diversité des données sera plus diversifiée et il y aura une diversité de données différente dans chaque région et chaque période.
Le quatrième est rapide.
La vitesse de traitement logique des données via les algorithmes est très rapide. La règle de la seconde permet d'obtenir rapidement des informations de grande valeur à partir de divers types de données. Ceci est également cohérent avec la technologie d'exploration de données traditionnelle. .
Pour plus d'articles techniques liés à Python, veuillez visiter la colonne Tutoriel Python pour apprendre !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!