Maison >Périphériques technologiques >IA >Spécialisé dans le traitement des « abus d'images » ! Elsevier, Nature et d'autres grandes revues utilisent l'IA pour découvrir des scientifiques infidèles
Il n'y a pas si longtemps, nous venons de recruter un lauréat du prix Nobel qui a publié de nombreux articles via la méthode PS.
Maintenant, de plus en plus d’organisations d’édition universitaire commencent à utiliser des logiciels d’IA pour détecter les données falsifiées. Les scientifiques qui ont la chance de le faire devraient y réfléchir à deux fois avant de s’engager.
Dans les cercles universitaires d’aujourd’hui, il est assez courant de copier, retourner, faire pivoter, déplacer, recadrer et réutiliser des images du même groupe de cellules.
À l'aide de ces images falsifiées, les chercheurs prétendent disposer de beaucoup de données et avoir réalisé de nombreuses expériences, alors que ce n'est pas le cas.
Selon Daniel Evanko, directeur des opérations de l'Association américaine pour la recherche sur le cancer (AACR), la duplication d'images était la principale raison pour laquelle l'AACR a rétracté des articles entre 2016 et 2020. Et la rétractation nuit non seulement à la réputation de l’auteur, mais aussi à la réputation de l’éditeur.
Afin d'éviter tout embarras pour les deux parties, des publications universitaires comme l'AACR ont commencé à utiliser un logiciel d'IA pour détecter les duplications d'images avant de publier des articles. Le logiciel s'appelle Proofig, un programme d'inspection d'images développé par une startup israélienne.
Evanko a présenté les résultats de l'étude pilote lors de la Conférence internationale d'examen par les pairs et de publication scientifique à Chicago début septembre, décrivant l'impact de Proofig sur l'AACR.
AACR publie dix revues de recherche et examine plus de 13 000 soumissions chaque année. De janvier 2021 à mai 2022, les responsables ont utilisé Proofig pour examiner 1 367 articles provisoirement acceptés pour publication, vérifié 208 articles avec des images en double et contacté les auteurs des articles.
Selon les médias étrangers : Dans de nombreux cas, la duplication d'images dans les journaux est due à une "utilisation abusive des images", et ce problème peut être résolu en soumettant de nouvelles données.
L'éditeur a dit : Est-ce si simple ?
Dans d'autres cas, Proofig a montré des signes très clairs de fraude. Sur ces 208 articles, 4 ont été retirés et 1 a été rejeté.
La fraude académique n'est pas rare et se produit fréquemment dans les établissements de mauvaise réputation. Cependant, la fraude académique est désormais fréquemment découverte dans les meilleurs laboratoires d’universités renommées.
Science a récemment publié une enquête rapportant que des décennies de recherche sur de nouveaux traitements et des essais cliniques échoués sur la maladie d'Alzheimer sont toutes basées sur un article très cité avec des images répétées.
L'une des preuves de fraude découvertes par Proofig était une série de lignes floues générées à l'aide de la technologie Western blots, qui ont été copiées, modifiées et collées dans les données de la souris. Ce type de fraude est difficile à repérer pour un œil non averti.
Dror Kolodkin-Gal, PDG de Proofig, a déclaré que trouver des changements aussi subtils serait une tâche plutôt fastidieuse pour la plupart des humains, mais que cela fonctionne bien pour les ordinateurs.
"Utilisation abusive d'images" par Gregg L. Semenza, lauréat du prix Nobel 2019
Lorsque Proofig fonctionne, il vérifie d'abord si une image spécifique correspond à d'autres sous-images dans le document. La sous-image peut être déplacée, retournée ou pivotée, recadrée ou copiée, il existe de nombreuses possibilités.
Proofig combinera des algorithmes de vision par ordinateur et d'intelligence artificielle pour extraire et classer des images. Ce type de calcul est très compliqué, mais heureusement, l’apprentissage automatique progresse rapidement.
"Avant l'avènement de l'intelligence artificielle, le simple fait d'extraire des sous-images d'un papier nécessitait dix fois plus d'investissement en R&D et Dieu sait comment le calculer. Qu'il s'agisse des avancées technologiques des algorithmes ou de la possibilité d'exécuter des GPU dans le cloud, il a apporté un énorme changement", a déclaré Kolodkin-Gal.
Bien sûr, un logiciel d'IA comme Proofig ne peut pas trouver les tricheurs par lui-même.
Élisabeth Bik, experte en criminalistique de l'image et consultante scientifique indépendante, a déclaré : Pour interpréter les résultats obtenus par le logiciel, nous avons toujours besoin d'une personne possédant les connaissances et l'expérience pertinentes. Après tout, l’œil humain peut surpasser un ordinateur dans certaines situations.
"Vous ne pouvez pas laisser le logiciel fonctionner tout seul, car il pourrait signaler beaucoup de choses qui ne posent pas de problème."
Bik utilise un autre logiciel d'IA au travail - ImageTwin. Parfois, il n’analyse pas très clairement les transferts de protéines. "Un Western Blot est essentiellement une bande noire sur un fond uni. Je peux voir certaines subtilités de la forme avec l'œil humain, mais ce logiciel ne peut tout simplement pas le voir
"C'est probablement à cause de notre façon de faire." Le travail des yeux et du cerveau est très compliqué. Je pense que peut-être parce que le logiciel ne recherche que les distances relatives, une bande noire ressemble à une bande noire et n'est pas non plus très efficace pour trouver de petits bords ou d'autres formes similaires", a déclaré Bik. .
"Picture Misuse" par Gregg L. Semenza, lauréat du prix Nobel 2019
L'examen des transferts de protéines est très difficile pour les machines, convient Kolodkin-Gal. "Il nous a fallu beaucoup d'investissements pour enfin trouver un bon algorithme permettant de trouver ces bandes. C'est trop difficile pour l'intelligence artificielle car les bandes sont très petites.
Différences dans le processus de publication À ce stade, les publications académiques sont utilisées." des outils d’inspection d’images comme Proofig. L'AACR analysera tous les manuscrits initialement acceptés, et Taylor & Francis ne l'utilisera que pour vérifier les articles remis en question par les éditeurs ou les pairs évaluateurs.
"Si le logiciel détecte une copie potentielle d'images ou une autre manipulation, et que cette détermination est soutenue par notre équipe d'experts, nous enquêterons conformément aux procédures et directives établies par le Comité d'éthique de la publication pour de tels incidents." le porte-parole de l'entreprise a déclaré cela.
Dans le processus de publication, le moment d'utiliser ces outils dépend du coût. Le traitement des images nécessite beaucoup de calculs, de sorte que les publications doivent payer les frais de cloud computing pour des entreprises comme Proofig.
"Utilisation abusive des images" par Gregg L. Semenza, lauréat du prix Nobel 2019
Il serait trop coûteux de filtrer chaque article au stade de la soumission. Par exemple, utiliser Proofig pour analyser 120 sous-images coûte 99 $. Pour vérifier minutieusement un article, Proofig doit gérer toutes les combinaisons possibles dans un article, ce qui peut être considéré comme une « énorme somme d'argent ».
Actuellement, des organisations telles que AACR et Taylor & Francis négocient pour personnaliser un service packagé pour leur entreprise à un prix moins cher.
Helen King, directrice de SAGE, a déclaré : « En raison du coût de la surveillance manuelle et de l'utilisation de logiciels, nous n'utilisons actuellement Proofig que lorsque les articles entrent dans des étapes de révision plus avancées. À ce jour, il a été utilisé dans près d'un tiers des pays. les inspections Le problème est noté dans un seul papier, et des connaissances professionnelles pertinentes sont ensuite nécessaires pour l'expliquer. "
Maintenant, de plus en plus d'organisations commencent à utiliser des logiciels d'IA. .
L'Association américaine pour la recherche clinique a également adopté Proofig, tandis que des éditeurs comme Frontiers ont également développé leurs propres outils.
Wiley utilise également une sorte de logiciel, tandis que PLOS, Elsevier et Nature sont soit ouverts aux projets, soit testant activement des projets.
Bien que les logiciels d'IA soient de mieux en mieux capables de détecter les données douteuses, ils ne peuvent pas détecter toutes les formes de tricherie de la part des scientifiques.
Proofig peut vérifier si les images sont dupliquées sur le même papier, mais il ne détectera pas si l'image est copiée ou traitée sur des papiers différents. De toute évidence, pour faire face à cette situation, Proofig doit créer une base de données de cache d'images capturées à partir d'articles publiés pour effectuer une comparaison complète.
"Utilisation abusive des images" par le lauréat du prix Nobel 2019 Gregg L. Semenza
"Le plus grand défi auquel nous sommes confrontés est le Big Data", a déclaré Kolodkin-Gal. "Si les publications n'unissent pas leurs forces et ne construisent pas une base de données d'images, le plagiat d'images restera un gros problème. Pour développer l'intelligence artificielle, il faut disposer du big data
Bien qu'il présente encore divers défauts, l'émergence de." Le logiciel Proofig reste un bon début pour lutter contre la tricherie et améliorer l'intégrité académique.
« Je pense que c'est une très bonne chose que les publications commencent à utiliser un logiciel car cela permet un certain contrôle de la qualité du processus de publication et aura un effet dissuasif. Ce type de logiciel permet de savoir aux auteurs : nous allons cibler. ce type de duplication de la révision de votre article. À mon avis, cela n'empêchera pas la fraude, mais cela rendra la tâche un peu plus difficile", a déclaré Bik.
Si l’IA peut réellement avoir un effet dissuasif suffisant sur la fraude scolaire, ce serait une bonne chose.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!