Cela ne coûte que 0,003 $ la fois, soit 20 fois moins cher que les humains ! ChatGPT met les annotateurs de données en danger-IA-php.cn

Cela ne coûte que 0,003 $ la fois, soit 20 fois moins cher que les humains ! ChatGPT met les annotateurs de données en danger

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 04, 2023 pm 12:00 PM

chatgptnlpmturk

Récemment, une équipe de recherche de l'Université de Zurich a découvert que ChatGPT surpassait les travailleurs du crowdsourcing sur plusieurs tâches d'annotation PNL, avec une grande cohérence, et ne coûtait qu'environ 0,003 $ par annotation, soit 20 fois moins cher que MTurk.

Actuellement, de nombreuses applications de traitement du langage naturel (NLP) nécessitent la prise en charge de données annotées de haute qualité, en particulier lorsque ces données sont utilisées pour des tâches telles que la formation de classificateurs ou l'évaluation des performances de modèles non supervisés.

Par exemple, les chercheurs en IA souhaitent souvent filtrer les données bruyantes des médias sociaux pour rechercher des corrélations, attribuer du texte à différents sujets ou catégories conceptuelles, ou mesurer son sentiment ou sa position.

Et, quelle que soit la méthode spécifique utilisée pour ces tâches (supervisées, semi-supervisées ou non supervisées), des données étiquetées sont nécessaires pour établir un ensemble de formation ou un étalon-or.

Cependant, dans la plupart des cas, pour réaliser un travail d'annotation de données de haute qualité, il est toujours indissociable du crowdsourcing de travailleurs sur la plateforme d'annotation de données ou d'annotateurs formés tels que des assistants de recherche pour le faire manuellement.

En règle générale, les annotateurs formés créent d'abord un ensemble de données de référence relativement petit, puis embauchent des travailleurs participatifs pour augmenter la quantité de données annotées et effectuer un travail répétitif. En fonction de leur taille et de leur complexité, les tâches d'annotation de données peuvent parfois être très longues et laborieuses. Non seulement elles nécessitent un certain coût de main d'œuvre, mais la qualité de l'annotation des données ne peut pas être garantie.

Alors, les machines peuvent-elles aider les humains à accomplir cette tâche fondamentale ?

Dans le passé, les machines n'étaient pas douées pour ce genre de tâches de « travail lent et minutieux », mais contre toute attente, la tâche « annotation des données » a été complétée par ChatGPT, et c'est encore mieux que la plupart des gens.

Cela ne coûte que 0,003 $ la fois, soit 20 fois moins cher que les humains ! ChatGPT met les annotateurs de données en danger

Dans une nouvelle étude publiée aujourd'hui, une équipe de recherche de l'Université de Zurich a utilisé un échantillon de 2 382 tweets pour démontrer que ChatGPT excelle dans les tâches multi-annotations telles que la détection de pertinence, de sujet et de cadre pour les travailleurs du crowdsourcing.

Le document de recherche pertinent s'intitule « ChatGPT surpasse les Crowd-Workers pour les tâches d'annotation de texte » et a été publié sur le site Web de préimpression arXiv.

Plus précisément, ChatGPT a surpassé les travailleurs du crowdsourcing en termes de précision zéro dans quatre des cinq tâches ; en termes d'accord intercodeur pour toutes les tâches, ChatGPT surpasse non seulement les travailleurs du crowdsourcing, mais également les annotateurs formés.

Cela ne coûte que 0,003 $ la fois, soit 20 fois moins cher que les humains ! ChatGPT met les annotateurs de données en danger

Performances d'annotation de données de texte à échantillon nul de ChatGPT

Il convient de mentionner que le coût de chaque annotation de ChatGPT est inférieur à 0,003 $, soit environ 20 fois moins cher que les plateformes d'annotation de données.

L'équipe de recherche estime que même si des recherches supplémentaires sont nécessaires pour mieux comprendre les performances de ChatGPT et d'autres LLM dans un contexte plus large, les résultats suggèrent qu'ils ont le potentiel de changer la façon dont les chercheurs annotent les données, améliorant considérablement l'efficacité de la classification des textes et détruire certains modèles économiques des plateformes d’annotation de données.

Au moins pour l'instant, ces résultats démontrent l'importance d'approfondir les propriétés et les capacités d'annotation de texte des LLM.

À l'avenir, l'équipe de recherche étudiera les performances de ChatGPT dans plusieurs langues, les performances de ChatGPT dans plusieurs types de textes (médias sociaux, médias d'information, législation, discours, etc.), en utilisant la chaîne de pensée (CoT) invites et autres stratégies Nous continuerons à travailler dur pour améliorer les performances de l'inférence à échantillon nul.

Il convient de mentionner que lorsque l'équipe de recherche menait ce travail, OpenAI n'avait pas encore publié GPT-4. Quel serait le résultat si GPT-4 était utilisé pour effectuer la tâche d'annotation des données ?

Référence :https://arxiv.org/abs/2303.15056

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article connexe

Gemma Scope: le microscope de Google pour regarder dans le processus de pensée de l'IAApr 17, 2025 am 11:55 AM

Explorer le fonctionnement interne des modèles de langue avec Gemma Scope Comprendre les complexités des modèles de langue IA est un défi important. La sortie de Google de Gemma Scope, une boîte à outils complète, offre aux chercheurs un moyen puissant de plonger

Qui est un analyste de Business Intelligence et comment en devenir un?Apr 17, 2025 am 11:44 AM

Déverrouiller le succès de l'entreprise: un guide pour devenir un analyste de Business Intelligence Imaginez transformer les données brutes en informations exploitables qui stimulent la croissance organisationnelle. C'est le pouvoir d'un analyste de Business Intelligence (BI) - un rôle crucial dans GU

Comment ajouter une colonne dans SQL? - Analytique VidhyaApr 17, 2025 am 11:43 AM

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Analyste d'entreprise vs analyste de donnéesApr 17, 2025 am 11:38 AM

Introduction Imaginez un bureau animé où deux professionnels collaborent sur un projet critique. L'analyste commercial se concentre sur les objectifs de l'entreprise, l'identification des domaines d'amélioration et la garantie d'alignement stratégique sur les tendances du marché. Simulé

Que sont le comte et le coude à Excel? - Analytique VidhyaApr 17, 2025 am 11:34 AM

Excel Counting and Analysis: Explication détaillée du nombre et des fonctions de compte Le comptage et l'analyse des données précises sont essentiels dans Excel, en particulier lorsque vous travaillez avec de grands ensembles de données. Excel fournit une variété de fonctions pour y parvenir, les fonctions Count et Count sont des outils clés pour compter le nombre de cellules dans différentes conditions. Bien que les deux fonctions soient utilisées pour compter les cellules, leurs cibles de conception sont ciblées sur différents types de données. Faisons des détails spécifiques du comptage et des fonctions de coude, mettons en évidence leurs caractéristiques et différences uniques et apprenez à les appliquer dans l'analyse des données. Aperçu des points clés Comprendre le nombre et le cou

Chrome est là avec l'IA: vivre quelque chose de nouveau tous les jours !!Apr 17, 2025 am 11:29 AM

La révolution de l'IA de Google Chrome: une expérience de navigation personnalisée et efficace L'intelligence artificielle (IA) transforme rapidement notre vie quotidienne, et Google Chrome mène la charge dans l'arène de navigation Web. Cet article explore les exciti

Côté humain de l'AI: le bien-être et le quadruple de basApr 17, 2025 am 11:28 AM

Réinventuation d'impact: le quadruple bas Pendant trop longtemps, la conversation a été dominée par une vision étroite de l’impact de l’IA, principalement axée sur le résultat du profit. Cependant, une approche plus holistique reconnaît l'interconnexion de BU

5 cas d'utilisation de l'informatique quantique qui change la donne que vous devriez connaîtreApr 17, 2025 am 11:24 AM

Les choses évoluent régulièrement vers ce point. L'investissement affluant dans les prestataires de services quantiques et les startups montre que l'industrie comprend son importance. Et un nombre croissant de cas d'utilisation réels émergent pour démontrer sa valeur

See all articles