Maison >Problème commun >Qu'est-ce que la désensibilisation au Big Data ?

Qu'est-ce que la désensibilisation au Big Data ?

Guanhuioriginal: 2020-06-12 09:45:054334parcourir

Qu'est-ce que la désensibilisation au Big Data ?

La désensibilisation des mégadonnées, également connue sous le nom de blanchiment des données, de privatisation des données ou de déformation des données, fait référence à la déformation de certaines informations sensibles via des règles de désensibilisation pour obtenir une protection fiable des données privées sensibles afin d'utiliser en toute sécurité des données réelles désensibilisées. ensembles de données dans les environnements de développement, de test et autres environnements hors production et externalisés.

Technologie de désensibilisation des données confidentielles

Habituellement, sur les plateformes Big Data, les données sont stockées dans un format structuré. Chaque table se compose de plusieurs lignes et chaque ligne de données est composée. de nombreuses colonnes. Selon les attributs de données de la colonne, les colonnes de données peuvent généralement être divisées dans les types suivants :

Les colonnes qui peuvent localiser avec précision une personne sont appelées colonnes identifiables, telles que le numéro d'identification, l'adresse , et nom, etc.
Une seule colonne ne peut pas localiser un individu, mais plusieurs colonnes d'informations peuvent être utilisées pour potentiellement identifier une personne. Ces colonnes sont appelées colonnes semi-identifiantes, telles que le code postal, la date de naissance et la date de naissance. genre. Un document de recherche américain affirme que 87 % des Américains peuvent être identifiés en utilisant uniquement le code postal, la date de naissance et le sexe.
Colonnes contenant des informations sensibles sur les utilisateurs, telles que les montants des transactions, les maladies et les revenus.
Autres colonnes qui ne contiennent pas d'informations utilisateur sensibles.

Types de fuite de données confidentielles

Les fuites de données confidentielles peuvent être divisées en plusieurs types. Selon le type, différentes données confidentielles peuvent généralement être. a utilisé le modèle de risque de fuite pour mesurer le risque de prévention des fuites de données confidentielles et de désensibilisation des données correspondant à différents algorithmes de désensibilisation des données. De manière générale, les types de violations de données confidentielles comprennent :

Violation d’identité personnelle. Lorsqu’un utilisateur de données confirme par quelque moyen que ce soit qu’une donnée d’une table de données appartient à une certaine personne, on parle de fuite d’identité personnelle. La fuite d’identité personnelle est la plus grave, car une fois qu’une fuite d’identité personnelle se produit, les utilisateurs de données peuvent obtenir des informations sensibles sur des individus spécifiques.

Fuite d'attributs. Lorsque les utilisateurs de données apprennent de nouvelles informations d'attribut sur une personne en fonction de la table de données à laquelle ils accèdent, on parle de fuite d'attributs. La fuite d'identité personnelle entraînera certainement une fuite d'attributs, mais la fuite d'attributs peut également se produire de manière indépendante.

Les relations avec les membres ont été divulguées. Lorsqu’un utilisateur de données peut confirmer que les données d’une personne existent dans une table de données, on parle de fuite d’adhésion. Le risque de fuite de relation d'appartenance est relativement faible. Une fuite d'identité personnelle et une fuite d'attributs signifient certainement une fuite de relation d'appartenance, mais une fuite de relation d'appartenance peut également se produire de manière indépendante.

Tutoriel recommandé : "PHP"

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

php 算法

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Les commandes de fonctionnement de Code Cloud et de Github sont-elles les mêmes ?Article suivant：Les commandes de fonctionnement de Code Cloud et de Github sont-elles les mêmes ?

Articles Liés

Voir plus