Maison > Article > Périphériques technologiques > N'avez-vous pas à vous soucier des problèmes de droits d'auteur liés aux données d'entraînement de l'IA ? La position du gouvernement japonais a suscité un débat houleux
Maintenant que l'IA générative est en plein essor, la question du droit d'auteur sur les données d'information utilisées pour entraîner les modèles qui la sous-tendent a toujours été au centre de l'attention des gens : qu'est-ce qui est considéré comme des données de formation légales ? Vais-je, par inadvertance, enfreindre les droits d'auteur de quelqu'un d'autre ?
En réponse, certains médias étrangers ont rapporté que le Comité gouvernemental japonais sur la stratégie en matière d'intelligence artificielle avait soumis un projet le 26 mai, déclarant qu'il n'obligerait pas les données utilisées dans la formation à l'intelligence artificielle à se conformer aux lois sur le droit d'auteur. La ministre japonaise de l'Éducation, de la Culture, des Sports et des Sciences (l'équivalent du ministère national de l'Éducation), Keiko Nagaoka, a confirmé la nouvelle lors d'une réunion locale, affirmant que La loi japonaise ne protège pas les droits d'auteur des matériaux utilisés pour la formation en IA.
Keiko Nagaoka Source de l'image : site officiel du ministère japonais de l'Éducation, de la Culture, des Sports, des Sciences et de la Technologie
Plus précisément, le 24 avril, lors de la deuxième sous-commission du Comité de surveillance de la gestion des colonies de la Chambre des représentants du Japon, un membre du Congrès japonais nommé Takashi Kii a eu une discussion directe avec Keiko Nagaoka.
Selon les questions et réponses compilées par Ji Yilong après la réunion, Keiko Nagaoka a déclaré en parlant du système juridique japonais (loi sur le droit d'auteur) concernant l'utilisation de l'IA pour l'analyse de l'information : « Au Japon, quelle que soit la méthode utilisée, non quelle que soit la méthode utilisée, que ce soit à des fins lucratives ou non, que ce soit pour des activités autres que la copie ou du contenu obtenu à partir de sites Web illégaux, les informations peuvent être utilisées pour analyser l'œuvre ”
.À cet égard, Ji Yilong estime que du point de vue de la protection des droits, le fait de « l'utilisation contre la volonté du titulaire du droit d'auteur » est problématique et qu'il est encore nécessaire de formuler de nouvelles réglementations pour protéger les titulaires du droit d'auteur.
En outre, ils ont discuté des questions liées à l'utilisation de chatbots IA (tels que ChatGPT) dans les écoles comme lignes directrices pédagogiques. Les médias étrangers ont rapporté que le système éducatif japonais devrait adopter cette technologie ou cet outil dès mars 2024. En réponse, Keiko Nagaoka n'a pas donné d'heure précise, mais a déclaré qu'elle répondrait "dès que possible".
Cette question a suscité un débat extrêmement répandu. Yann LeCun, scientifique en chef du Meta, l'un des trois géants de l'IA, a tweeté ceci :
Le Japon est devenu un paradis pour le machine learning.
Cependant, certains internautes l'ont accusé de ne pas qualifier de « paradis » « le fait de pouvoir voler le droit d'auteur intellectuel sans être affecté ». Yang Likun a répondu sous le commentaire : L'essence de ce qui constitue la « propriété » de la propriété intellectuelle est définie et appliquée par le gouvernement. . Il est également soumis aux restrictions gouvernementales. Le principe directeur est de maximiser le bien public, et non les droits des propriétaires de contenu.
En fait, les internautes ont lancé une discussion animée sur la question de savoir si les matériels de formation sur l'IA devraient bénéficier d'une protection par le droit d'auteur. Certains sont d'accord avec la position du ministre japonais et proposent qu'un lot de données d'images à entraîner soit traité couche par couche et finalement converti en modèles ou données d'IA, codes ou autres formats électroniques compréhensibles par les ordinateurs. C'est-à-dire que les données utilisées pour la formation du modèle sont fondamentalement très perdantes, donc même dans le pire des cas, il ne s'agit que d'un « travail dérivé », ce qui est certainement un usage équitable. La violation du droit d'auteur ne se produit que lorsqu'un modèle copie du code, des images ou des livres protégés par le droit d'auteur et les distribue dans le résultat final.
Il y a une objection immédiate à cela : avec ou sans perte, les données d'entraînement apportent de la valeur. La formation d'un modèle ne serait pas possible sans qu'un certain nombre de personnes consacrent du temps à produire ce qui est finalement utilisé comme données de formation.
Certains internautes ont souligné qu'il est inutile de discuter des questions de droit d'auteur. Les êtres humains apprennent et évoluent toujours en étudiant des choses qui existent déjà et qui ont été publiées. Il est donc plus important de discuter de la manière d'utiliser, de partager ou d'organiser le contrôle de manière plus pratique. et raisonnablement du niveau réglementaire ces « informations partagées ».
Écrit par : le journaliste de Nandu, Yang Bowen
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!