Maison > Article > Périphériques technologiques > Comment protéger la confidentialité de l’intelligence artificielle ?
Alors que les entreprises et les consommateurs sont enthousiasmés par le potentiel de l’IA à transformer la vie quotidienne, les problèmes de confidentialité découlant de son utilisation généralisée restent une préoccupation majeure. De toute évidence, alors que de plus en plus de données personnelles sont intégrées aux modèles d’IA, de nombreux consommateurs s’inquiètent à juste titre de leur vie privée et de la manière dont leurs données sont utilisées.
Cet article est destiné à aider ces consommateurs à construire une base de connaissances plus approfondie sur les capacités de confidentialité de l'IA. De plus, il fournit des conseils aux propriétaires et aux dirigeants d’entreprise sur la manière de mieux comprendre les préoccupations des clients et d’utiliser l’IA de manière à protéger la confidentialité sans sacrifier les fonctionnalités.
Les modèles d'IA extraient des données de formation de tous les coins du Web. Malheureusement, de nombreux fournisseurs d’IA ignorent ou s’en moquent lorsqu’ils utilisent des œuvres d’art, du contenu ou d’autres propriétés intellectuelles protégées par des droits d’auteur sans leur consentement.
À mesure que les modèles sont entraînés, recyclés et affinés à l’aide de ces données, ce problème devient de plus en plus grave. De nombreux modèles d’IA actuels sont si complexes que même leurs constructeurs ne peuvent pas affirmer avec certitude qu’ils utilisent quelles données et qui y a accès. à cela.
Lorsque les utilisateurs de modèles d'intelligence artificielle saisissent leurs propres données sous forme de requêtes, ces données ont le potentiel de faire partie du futur ensemble de données d'entraînement du modèle. Lorsque cela se produit, ces données peuvent être affichées en sortie des requêtes d'autres utilisateurs, ce qui constitue un problème particulièrement important si les utilisateurs ont saisi des données sensibles dans le système.
Actuellement, certains pays et agences de réglementation élaborent des réglementations sur l'IA et des politiques d'utilisation sûre, mais il n'existe pas de norme unifiée pour tenir les fournisseurs d'IA responsables de la manière dont ils construisent et utilisent les outils d'IA
Dans le passé. , de nombreux fournisseurs d’IA ont été critiqués pour leurs violations de la propriété intellectuelle et leurs processus opaques de formation et de collecte de données. Dans l’état actuel des choses, cependant, la plupart des fournisseurs d’IA ont le droit de déterminer sans interférence leurs propres règles de stockage de données, de cybersécurité et d’utilisation. utilisé pour remplacer les méthodes d’authentification traditionnelles. Dans le même temps, les équipements de surveillance publique utilisent également souvent l'intelligence artificielle pour analyser les données biométriques afin d'identifier les individus plus rapidement. la surveillance est limitée. Dans de nombreux cas, les individus ne savent même pas que leurs données biométriques ont été collectées, et encore moins qu’elles sont stockées et utilisées à d’autres fins.
Lorsqu'un utilisateur interagit avec une publicité, une vidéo sur les réseaux sociaux ou pratiquement n'importe quelle propriété Web, les métadonnées de cette interaction peuvent être stockées avec l'historique de recherche et les intérêts de l'utilisateur pour un ciblage de contenu plus précis à l'avenir
Cette méthode de collecte de métadonnées existe depuis des années, mais avec l'aide de l'intelligence artificielle, davantage de données peuvent être collectées et interprétées à grande échelle, permettant aux entreprises technologiques de cibler davantage les utilisateurs sans qu'ils sachent comment fonctionnent les informations. Bien que la plupart des sites d'utilisateurs aient des politiques qui mentionnent ces pratiques de collecte de données, elles ne sont mentionnées que brièvement dans d'autres textes de politique, de sorte que la plupart des utilisateurs ne réalisent pas ce qu'ils ont accepté et placent tout le contenu sur eux-mêmes et sur leurs appareils mobiles en cours d'examen.
Bien que certains fournisseurs d'IA puissent choisir d'intégrer des fonctionnalités et des protections de base en matière de cybersécurité, de nombreux modèles d'IA ne disposent pas de protections de cybersécurité natives. Cela permet aux utilisateurs non autorisés et aux acteurs malveillants d'accéder et d'utiliser très facilement les données d'autres utilisateurs, y compris les informations personnelles identifiables (PII).
Période de stockage des données prolongée
Par exemple, la politique d’OpenAI stipule qu’elle peut stocker les données d’entrée et de sortie des utilisateurs jusqu’à 30 jours afin d’identifier les abus. Cependant, on ne sait pas quand ni comment l'entreprise examine plus granulairement les données personnelles des utilisateurs à leur insu
Web scraping et web crawling
Les outils d'IA s'appuient généralement sur le web scraping et l'exploration du web pour construire ensembles de données de formation car ils ne nécessitent pas d'autorisations spéciales et permettent également aux fournisseurs de collecter de grandes quantités de données différentes
Le contenu est extrait de sources publiques sur Internet, notamment de sites Web tiers, de Wikipédia, de bibliothèques numériques, etc. Ces dernières années, les métadonnées des utilisateurs sont également devenues la majorité du contenu collecté via le web scraping et l’exploration. Ces métadonnées proviennent souvent d'ensembles de données marketing et publicitaires, ainsi que de sites Web contenant votre public cible et le contenu qui l'intéresse le plus.
Lorsque les utilisateurs saisissent des questions ou d'autres données dans un modèle d'IA, la plupart des modèles d'IA stockent ces données pendant au moins quelques jours. Bien que ces données ne puissent jamais être utilisées à d'autres fins, la recherche montre que de nombreux outils d'IA non seulement collecteront ces données, mais les conserveront également pour de futures formations. comme les microphones capables de détecter les voix humaines, peuvent être utilisés pour collecter des données biométriques et identifier des humains à leur insu ou sans leur consentement
Capteurs et appareils IoT
Les capteurs et les systèmes informatiques de pointe de l'Internet des objets (IoT) collectent de grandes quantités de données en temps réel et les traitent à proximité pour effectuer des tâches informatiques plus importantes et plus rapides. Les logiciels d'intelligence artificielle utilisent généralement la base de données du système IoT et collectent des données pertinentes via des méthodes telles que l'apprentissage des données, l'ingestion de données, les protocoles et passerelles IoT sécurisés et les API
API fournit des interfaces avec différents types de logiciels d'entreprise, permettant aux utilisateurs à Capacité à collecter et intégrer facilement diverses données pour l'analyse et la formation en intelligence artificielle. Avec les API et la configuration appropriées, les utilisateurs peuvent collecter des données à partir de CRM, de bases de données, d'entrepôts de données et de systèmes basés sur le cloud et sur site.
Les dossiers publics sont généralement collectés et inclus dans les ensembles de formation en IA, qu'ils soient ou non ont été la numérisation. Des informations sur les entreprises cotées en bourse, les événements actuels et historiques, les casiers judiciaires et d'immigration et d'autres informations publiques peuvent être collectées sans autorisation préalable. méthode permettant aux fournisseurs d'IA de collecter des données auprès des utilisateurs
Solutions aux problèmes d'IA et de confidentialité
Utiliser l’IA de manière responsable pour protéger la vie privée des utilisateurs demande des efforts supplémentaires, mais cela en vaut la peine si l’on considère l’impact des violations de la vie privée sur l’image publique d’une entreprise. À mesure que cette technologie évolue et devient de plus en plus répandue dans notre vie quotidienne, suite à l'adoption de lois sur l'IA et au développement d'une IA plus spécifique et conforme à la culture d'entreprise et aux attentes des clients en matière de confidentialité, l'utilisation des meilleures pratiques deviendra cruciale.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!