


Cela ne coûte que 0,003 $ la fois, soit 20 fois moins cher que les humains ! ChatGPT met les annotateurs de données en danger
Récemment, une équipe de recherche de l'Université de Zurich a découvert que ChatGPT surpassait les travailleurs du crowdsourcing sur plusieurs tâches d'annotation PNL, avec une grande cohérence, et ne coûtait qu'environ 0,003 $ par annotation, soit 20 fois moins cher que MTurk.
Actuellement, de nombreuses applications de traitement du langage naturel (NLP) nécessitent la prise en charge de données annotées de haute qualité, en particulier lorsque ces données sont utilisées pour des tâches telles que la formation de classificateurs ou l'évaluation des performances de modèles non supervisés.
Par exemple, les chercheurs en IA souhaitent souvent filtrer les données bruyantes des médias sociaux pour rechercher des corrélations, attribuer du texte à différents sujets ou catégories conceptuelles, ou mesurer son sentiment ou sa position.
Et, quelle que soit la méthode spécifique utilisée pour ces tâches (supervisées, semi-supervisées ou non supervisées), des données étiquetées sont nécessaires pour établir un ensemble de formation ou un étalon-or.
Cependant, dans la plupart des cas, pour réaliser un travail d'annotation de données de haute qualité, il est toujours indissociable du crowdsourcing de travailleurs sur la plateforme d'annotation de données ou d'annotateurs formés tels que des assistants de recherche pour le faire manuellement.
En règle générale, les annotateurs formés créent d'abord un ensemble de données de référence relativement petit, puis embauchent des travailleurs participatifs pour augmenter la quantité de données annotées et effectuer un travail répétitif. En fonction de leur taille et de leur complexité, les tâches d'annotation de données peuvent parfois être très longues et laborieuses. Non seulement elles nécessitent un certain coût de main d'œuvre, mais la qualité de l'annotation des données ne peut pas être garantie.
Alors, les machines peuvent-elles aider les humains à accomplir cette tâche fondamentale ?
Dans le passé, les machines n'étaient pas douées pour ce genre de tâches de « travail lent et minutieux », mais contre toute attente, la tâche « annotation des données » a été complétée par ChatGPT, et c'est encore mieux que la plupart des gens.
Dans une nouvelle étude publiée aujourd'hui, une équipe de recherche de l'Université de Zurich a utilisé un échantillon de 2 382 tweets pour démontrer que ChatGPT excelle dans les tâches multi-annotations telles que la détection de pertinence, de sujet et de cadre pour les travailleurs du crowdsourcing.
Le document de recherche pertinent s'intitule « ChatGPT surpasse les Crowd-Workers pour les tâches d'annotation de texte » et a été publié sur le site Web de préimpression arXiv.
Plus précisément, ChatGPT a surpassé les travailleurs du crowdsourcing en termes de précision zéro dans quatre des cinq tâches ; en termes d'accord intercodeur pour toutes les tâches, ChatGPT surpasse non seulement les travailleurs du crowdsourcing, mais également les annotateurs formés.
Performances d'annotation de données de texte à échantillon nul de ChatGPT
Il convient de mentionner que le coût de chaque annotation de ChatGPT est inférieur à 0,003 $, soit environ 20 fois moins cher que les plateformes d'annotation de données.
L'équipe de recherche estime que même si des recherches supplémentaires sont nécessaires pour mieux comprendre les performances de ChatGPT et d'autres LLM dans un contexte plus large, les résultats suggèrent qu'ils ont le potentiel de changer la façon dont les chercheurs annotent les données, améliorant considérablement l'efficacité de la classification des textes et détruire certains modèles économiques des plateformes d’annotation de données.
Au moins pour l'instant, ces résultats démontrent l'importance d'approfondir les propriétés et les capacités d'annotation de texte des LLM.
À l'avenir, l'équipe de recherche étudiera les performances de ChatGPT dans plusieurs langues, les performances de ChatGPT dans plusieurs types de textes (médias sociaux, médias d'information, législation, discours, etc.), en utilisant la chaîne de pensée (CoT) invites et autres stratégies Nous continuerons à travailler dur pour améliorer les performances de l'inférence à échantillon nul.
Il convient de mentionner que lorsque l'équipe de recherche menait ce travail, OpenAI n'avait pas encore publié GPT-4. Quel serait le résultat si GPT-4 était utilisé pour effectuer la tâche d'annotation des données ?
Référence :https://arxiv.org/abs/2303.15056
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Explorer le fonctionnement interne des modèles de langue avec Gemma Scope Comprendre les complexités des modèles de langue IA est un défi important. La sortie de Google de Gemma Scope, une boîte à outils complète, offre aux chercheurs un moyen puissant de plonger

Déverrouiller le succès de l'entreprise: un guide pour devenir un analyste de Business Intelligence Imaginez transformer les données brutes en informations exploitables qui stimulent la croissance organisationnelle. C'est le pouvoir d'un analyste de Business Intelligence (BI) - un rôle crucial dans GU

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Introduction Imaginez un bureau animé où deux professionnels collaborent sur un projet critique. L'analyste commercial se concentre sur les objectifs de l'entreprise, l'identification des domaines d'amélioration et la garantie d'alignement stratégique sur les tendances du marché. Simulé

Excel Counting and Analysis: Explication détaillée du nombre et des fonctions de compte Le comptage et l'analyse des données précises sont essentiels dans Excel, en particulier lorsque vous travaillez avec de grands ensembles de données. Excel fournit une variété de fonctions pour y parvenir, les fonctions Count et Count sont des outils clés pour compter le nombre de cellules dans différentes conditions. Bien que les deux fonctions soient utilisées pour compter les cellules, leurs cibles de conception sont ciblées sur différents types de données. Faisons des détails spécifiques du comptage et des fonctions de coude, mettons en évidence leurs caractéristiques et différences uniques et apprenez à les appliquer dans l'analyse des données. Aperçu des points clés Comprendre le nombre et le cou

La révolution de l'IA de Google Chrome: une expérience de navigation personnalisée et efficace L'intelligence artificielle (IA) transforme rapidement notre vie quotidienne, et Google Chrome mène la charge dans l'arène de navigation Web. Cet article explore les exciti

Réinventuation d'impact: le quadruple bas Pendant trop longtemps, la conversation a été dominée par une vision étroite de l’impact de l’IA, principalement axée sur le résultat du profit. Cependant, une approche plus holistique reconnaît l'interconnexion de BU

Les choses évoluent régulièrement vers ce point. L'investissement affluant dans les prestataires de services quantiques et les startups montre que l'industrie comprend son importance. Et un nombre croissant de cas d'utilisation réels émergent pour démontrer sa valeur


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Version Mac de WebStorm
Outils de développement JavaScript utiles

SublimeText3 Linux nouvelle version
Dernière version de SublimeText3 Linux

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

SublimeText3 version anglaise
Recommandé : version Win, prend en charge les invites de code !

Adaptateur de serveur SAP NetWeaver pour Eclipse
Intégrez Eclipse au serveur d'applications SAP NetWeaver.