


News le 6 avril, OpenAI a publié un article mercredi, heure locale des États-Unis, détaillant ses méthodes pour assurer la sécurité de l'IA, notamment en effectuant des évaluations de sécurité, en améliorant les garanties après la publication, en protégeant les enfants et en respectant la vie privée. L’entreprise a déclaré qu’il était essentiel de garantir que les systèmes d’IA soient construits, déployés et utilisés en toute sécurité pour réaliser sa mission.
Voici le texte intégral de l'article d'OpenAI :
OpenAI s'engage à garantir une sécurité renforcée de l'IA qui profite au plus grand nombre. Nous savons que nos outils d’IA apportent aujourd’hui beaucoup d’aide aux gens. Des utilisateurs du monde entier nous ont signalé que ChatGPT les aidait à améliorer leur productivité, à renforcer leur créativité et à offrir une expérience d'apprentissage sur mesure. Mais nous reconnaissons également que, comme pour toute technologie, ces outils comportent de réels risques. C'est pourquoi nous travaillons dur pour garantir la sécurité à tous les niveaux du système.
Créer un système d'intelligence artificielle plus sûr
Avant de lancer tout nouveau système d'intelligence artificielle, nous effectuerons des tests rigoureux, solliciterons l'avis d'experts externes et améliorerons les performances du modèle grâce à des techniques telles que l'apprentissage par renforcement avec retour humain. Dans le même temps, nous avons également mis en place de vastes systèmes de sécurité et de surveillance.
Prenons l'exemple de notre dernier modèle GPT-4. Après avoir terminé la formation, nous avons effectué des tests à l'échelle de l'entreprise pendant 6 mois maximum pour nous assurer qu'il était plus sécurisé et plus fiable avant sa sortie publique.
Nous pensons que les systèmes d'intelligence artificielle puissants doivent faire l'objet d'évaluations de sécurité rigoureuses. Une réglementation est nécessaire pour garantir une adoption généralisée de cette pratique. C’est pourquoi nous nous engageons activement avec les gouvernements pour discuter de la meilleure forme de réglementation.
Apprenez de l'utilisation réelle et améliorez les garanties
Nous faisons de notre mieux pour prévenir les risques prévisibles avant le déploiement du système, mais l'apprentissage en laboratoire est toujours limité. Nous effectuons des recherches et des tests approfondis, mais nous ne pouvons pas prédire comment les gens pourraient utiliser notre technologie ou en faire un mauvais usage. Par conséquent, nous pensons que l’apprentissage de l’utilisation réelle est un élément essentiel dans la création et la publication de systèmes d’IA de plus en plus sécurisés.
Nous publions soigneusement et progressivement de nouveaux systèmes d'IA, avec des garanties substantielles en place, et continuons à nous améliorer en fonction des leçons que nous apprenons.
Nous fournissons les modèles les plus puissants dans nos propres services et API afin que les développeurs puissent intégrer la technologie directement dans leurs applications. Cela nous permet de surveiller et de prendre des mesures en cas d'abus et d'élaborer des réponses. De cette façon, nous pouvons prendre des mesures pratiques au lieu de simplement imaginer comment y faire face en théorie.
L'expérience de l'utilisation réelle nous a également amené à développer des politiques de plus en plus granulaires pour lutter contre les comportements qui présentent des risques réels pour les personnes, tout en permettant à notre technologie d'être utilisée de manière plus bénéfique.
Nous pensons que la société a besoin de plus de temps pour s'adapter à une intelligence artificielle de plus en plus puissante et que toutes les personnes concernées devraient avoir leur mot à dire dans le développement futur de l'intelligence artificielle. Le déploiement itératif aide les différentes parties prenantes à engager plus efficacement des conversations sur les technologies d’IA, et il est essentiel d’avoir une expérience directe de l’utilisation de ces outils.
Protéger les enfants
L'un des axes de notre travail en matière de sécurité est la protection des enfants. Nous exigeons que les personnes utilisant nos outils d'intelligence artificielle soient âgées de 18 ans ou plus, ou de 13 ans ou plus avec le consentement de leurs parents. Actuellement, nous travaillons sur la fonctionnalité de vérification.
Nous n'autorisons pas l'utilisation de notre technologie pour générer du contenu haineux, harcelant, violent ou adulte. Le dernier GPT-4 est 82 % moins susceptible de répondre aux demandes de contenu restreint que le GPT-3.5. Nous disposons de systèmes robustes pour surveiller les abus. GPT-4 est désormais disponible pour les abonnés de ChatGPT Plus, et nous espérons permettre à davantage de personnes d'en faire l'expérience au fil du temps.
Nous avons pris des mesures importantes pour minimiser le potentiel de nos modèles de produire du contenu préjudiciable aux enfants. Par exemple, lorsqu'un utilisateur tente de télécharger du matériel abusif sans danger pour les enfants sur notre outil de génération d'images, nous le bloquons et signalons le problème au Centre national pour les enfants disparus et exploités.
En plus de la protection de sécurité par défaut, nous travaillons avec des organisations de développement telles que l'organisation à but non lucratif Khan Academy pour adapter les mesures de sécurité à leurs besoins. Khan Academy a développé un assistant d'intelligence artificielle qui peut servir de tuteur virtuel pour les étudiants et d'assistant de classe pour les enseignants. Nous travaillons également sur des fonctionnalités qui permettent aux développeurs de définir des normes plus strictes pour la sortie des modèles afin de mieux prendre en charge les développeurs et les utilisateurs qui ont besoin de telles fonctionnalités.
Respectez la confidentialité
Nos grands modèles linguistiques sont formés sur un vaste corpus de texte, y compris du contenu accessible au public, du contenu sous licence et du contenu généré par des réviseurs humains. Nous n'utilisons pas ces données pour vendre nos services ou notre publicité, ni pour créer des profils. Nous utilisons simplement ces données pour améliorer la capacité de nos modèles à aider les gens, par exemple en rendant ChatGPT plus intelligent en ayant davantage de conversations avec les gens.
Bien qu'une grande partie de nos données de formation incluent des informations personnelles disponibles sur le Web public, nous souhaitons que nos modèles apprennent à connaître le monde dans son ensemble, et non les individus. Par conséquent, nous nous engageons à supprimer les informations personnelles des ensembles de données de formation lorsque cela est possible, à affiner les modèles pour refuser les demandes de requête d'informations personnelles et à répondre aux demandes des individus visant à supprimer leurs informations personnelles de nos systèmes. Ces mesures minimisent la probabilité que notre modèle génère des réponses contenant des informations personnelles.
Amélioration de la précision factuelle
Les grands modèles linguistiques d'aujourd'hui peuvent prédire les prochains mots susceptibles d'être utilisés en fonction des modèles précédents et du texte saisi par l'utilisateur. Mais dans certains cas, le mot suivant le plus probable peut en réalité être factuellement incorrect.
L'amélioration de l'exactitude factuelle est l'un des objectifs d'OpenAI et de nombreux autres organismes de recherche en IA, et nous progressons. Nous avons amélioré l'exactitude factuelle de GPT-4 en tirant parti des commentaires des utilisateurs sur les résultats de ChatGPT qui ont été signalés comme incorrects en tant que source de données principale. Par rapport au GPT-3.5, le GPT-4 est plus susceptible de produire un contenu factuel, avec une amélioration de 40 %.
Nous nous efforçons d'être aussi transparents que possible lorsque les utilisateurs s'inscrivent pour utiliser l'outil afin d'éviter d'éventuelles réponses incorrectes de ChatGPT. Cependant, nous avons reconnu qu’il reste encore du travail à faire pour réduire davantage le risque de malentendu et sensibiliser le public aux limites actuelles de ces outils d’IA.
Recherche et engagement continus
Nous pensons qu'un moyen pratique de résoudre le problème de la sécurité de l'IA consiste à investir plus de temps et de ressources dans des techniques efficaces d'atténuation et d'étalonnage et à cibler les situations du monde réel où elles peuvent être utilisées à mauvais escient pour tester.
Il est important de noter que nous pensons que l’amélioration de la sécurité et des capacités de l’IA doit se faire simultanément. Notre meilleur travail de sécurité à ce jour a été réalisé en travaillant avec nos modèles les plus performants, car ils suivent mieux les instructions de l'utilisateur et sont plus faciles à exploiter ou à « guider ».
Nous créerons et déploierons des modèles plus performants avec une prudence croissante, et continuerons à renforcer les précautions de sécurité à mesure que les systèmes d'IA évoluent.
Bien que nous ayons attendu plus de 6 mois pour déployer GPT-4 afin de mieux comprendre ses capacités, ses avantages et ses risques, l'amélioration de la sécurité des systèmes d'IA peut parfois prendre plus de temps. Par conséquent, les décideurs politiques et les développeurs d’IA doivent veiller à ce que le développement et le déploiement de l’IA soient efficacement réglementés à l’échelle mondiale afin que personne ne prenne de raccourcis pour garder une longueur d’avance. Il s’agit d’un défi difficile qui nécessite une innovation technologique et institutionnelle, mais nous sommes désireux d’y contribuer.
Résoudre les problèmes de sécurité de l’IA nécessitera également un débat, une expérimentation et un engagement approfondis, notamment en fixant des limites au comportement des systèmes d’IA. Nous avons encouragé et continuerons de promouvoir la collaboration et le dialogue ouvert entre les parties prenantes afin de créer un écosystème d’IA plus sûr. (Xiao Xiao)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Exploiter la puissance de l'IA sur disvise: construire une CLI de chatbot personnelle Dans un passé récent, le concept d'un assistant d'IA personnel semblait être une science-fiction. Imaginez Alex, un passionné de technologie, rêvant d'un compagnon d'IA intelligent et local - celui qui ne dépend pas

Leur lancement inaugural de l'AI4MH a eu lieu le 15 avril 2025, et le Dr Tom Insel, M.D., célèbre psychiatre et neuroscientifique, a été le conférencier de lancement. Le Dr Insel est réputé pour son travail exceptionnel dans la recherche en santé mentale et la techno

"Nous voulons nous assurer que la WNBA reste un espace où tout le monde, les joueurs, les fans et les partenaires d'entreprise, se sentent en sécurité, appréciés et autonomes", a déclaré Engelbert, abordé ce qui est devenu l'un des défis les plus dommageables des sports féminins. L'anno

Introduction Python excelle comme un langage de programmation, en particulier dans la science des données et l'IA générative. La manipulation efficace des données (stockage, gestion et accès) est cruciale lorsqu'il s'agit de grands ensembles de données. Nous avons déjà couvert les nombres et ST

Avant de plonger, une mise en garde importante: les performances de l'IA sont non déterministes et très usagées. En termes plus simples, votre kilométrage peut varier. Ne prenez pas cet article (ou aucun autre) article comme le dernier mot - au lieu, testez ces modèles sur votre propre scénario

Construire un portefeuille AI / ML hors concours: un guide pour les débutants et les professionnels La création d'un portefeuille convaincant est cruciale pour sécuriser les rôles dans l'intelligence artificielle (IA) et l'apprentissage automatique (ML). Ce guide fournit des conseils pour construire un portefeuille

Le résultat? L'épuisement professionnel, l'inefficacité et un écart d'élargissement entre la détection et l'action. Rien de tout cela ne devrait être un choc pour quiconque travaille en cybersécurité. La promesse d'une IA agentique est devenue un tournant potentiel, cependant. Cette nouvelle classe

Impact immédiat contre partenariat à long terme? Il y a deux semaines, Openai s'est avancé avec une puissante offre à court terme, accordant aux étudiants des États-Unis et canadiens d'accès gratuit à Chatgpt Plus jusqu'à la fin mai 2025. Cet outil comprend GPT - 4O, un A


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

MinGW - GNU minimaliste pour Windows
Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

DVWA
Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

Listes Sec
SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit