Maison  >  Article  >  Périphériques technologiques  >  Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, l'artefact de traitement des graphiques, est en ligne.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, l'artefact de traitement des graphiques, est en ligne.

WBOY
WBOYavant
2023-06-12 19:24:10871parcourir

Ce processus de fonctionnement tout en douceur est tout simplement une bonne nouvelle pour les professionnels !

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Récemment, des chercheurs de l'Institut d'automatisation, de l'Académie chinoise des sciences, de l'école polytechnique de Hong Kong et d'autres institutions ont créé un « assistant IA de feuille » SheetCopilot Execute sur des logiciels (tels qu'Excel, GoogleSheets, etc. .). SheetCopilot peut se connecter rapidement à plusieurs logiciels de traitement de tableaux et prend en charge les opérations multi-tables, le dessin de graphiques et la génération de tableaux croisés dynamiques. Il devrait permettre le traitement et la visualisation de données de tableaux dans plusieurs domaines et franchir une étape clé vers la réalisation d'un assistant intelligent généraliste.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Site Web : https://sheetcopilot-demo.github.io/

Papier : https://arxiv.org/abs/2305.19308

Commençons à travers Les exemples suivants montrent comment SheetCopilot peut améliorer considérablement l'efficacité du travail.

Supposons que vous soyez un débutant et qu'un jour votre patron vous demande de l'aider à analyser les données de vente. Lorsque vous recevez le formulaire et que vous le regardez, vous serez ébloui par les milliers de lignes de données. Vous ne savez pas par où commencer, alors vous le vérifiez au fur et à mesure.

Tout d'abord, vous essayez d'extraire les noms de chaque produit, puis d'utiliser une formule pour additionner les revenus de chaque produit.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Après avoir travaillé dessus pendant plus de 20 minutes, SUMIF n'arrêtait pas de signaler les erreurs "#NAME?", alors j'ai abandonné.

J'ai continué à chercher en ligne et j'ai découvert qu'il existe un outil aussi pratique que le tableau croisé dynamique, j'ai donc commencé le deuxième défi.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Cela a pris plus de vingt minutes et j'ai finalement réussi. L'ensemble du processus a duré près d'une heure et l'efficacité n'était pas satisfaisante. Chaque fois que votre patron vous confie une nouvelle tâche de traitement de formulaire, votre expérience antérieure est de peu d'utilité, vous ne pouvez donc consulter le site Web et le traiter qu'à partir de zéro.

Vos collègues utilisent SheetCopilot et peuvent réaliser toutes sortes de requêtes étranges en quelques secondes seulement :).

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Voyant que SheetCopilot est si fluide, vous l'avez essayé et dessiner une image est un jeu d'enfant.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Avec SheetCopilot, vous n'avez plus besoin de faire glisser la souris sur la moitié d'un tableau pour sélectionner des données qui dépassent l'écran, et vous pouvez facilement déplacer des milliers de lignes de données entre plusieurs tableaux.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Pourquoi SheetCopilot

Les gens souhaitent depuis longtemps pouvoir maîtriser des logiciels complexes même sans expérience professionnelle. Beaucoup d'entre nous se sont retrouvés dans des situations où nous ne savions pas comment naviguer dans l'interface encombrante de PhotoShop, voulions analyser des données mais ne connaissions pas les fonctionnalités avancées des tableaux croisés dynamiques, voulions dessiner des engrenages mais ne connaissions rien à Solidworks.

Avec l'avènement des grands modèles de langage (LLM) dotés de puissantes capacités de compréhension et de génération du langage, cette vision est plus proche que jamais de la réalité. Si LLM peut être guidé pour maîtriser divers logiciels, le potentiel presque illimité du LLM peut être libéré, permettant ainsi à la productivité humaine d'atteindre des sommets sans précédent.

Cet article souligne que le tableur est une base idéale pour mener cette recherche car il s'agit d'un outil de production courant et polyvalent. Cependant, la manipulation des tables est confrontée à divers défis, et il est difficile pour les utilisateurs de maîtriser suffisamment de compétences en traitement de tables et en programmation pour faire face aux exigences des tâches en constante évolution.

S'il existe un agent d'IA généraliste maîtrisant de riches compétences en matière de contrôle logiciel, non seulement l'efficacité du bureau sera considérablement améliorée, mais la production de l'entreprise sera également considérablement accélérée. L'émergence de SheetCopilot correspond tout simplement à la vision des gens.

Quels sont les points forts de SheetCopilot

1. Couvrant les exigences typiques du traitement des tables

SheetCopilot couvre presque toutes les tâches typiques des opérations sur les tables et peut parfaitement effectuer diverses tâches de génération de graphiques.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Analyse des données de vente

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Dessin de graphique expérimental

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.Calcul de formule complexe

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.Appliquer la mise en forme conditionnelle

2 Au-delà de la méthode basée sur VBA

SheetCopilot est supérieure à la méthode de génération de code VBA et de son exécution avec GPT. -3,5, La solution générée est nettement meilleure que cette dernière (voir la figure ci-dessous), ce qui fait que SheetCopilot devrait devenir à l'avenir un puissant outil auxiliaire d'IA pour le personnel de traitement des données.

De plus, par rapport au code VBA obscur, les solutions générées par SheetCopilot contiennent des étapes faciles à comprendre, ce qui élimine la douleur liée à l'apprentissage d'un nouveau langage de programmation et au débogage difficile.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.Gauche : long code VBA ; à droite : la solution simple et facile à comprendre de SheetCopilot.

3. Expérience d'utilisation confortable

SheetCopilot Lorsque la connexion réseau est stable, il suffit d'environ 10 étapes d'opérations de combinaison multi-tables pour combiner des tables avec des milliers de lignes et des dizaines de colonnes. Effectuez les tâches rapidement. Cela libère non seulement les yeux fatigués de l'utilisateur, mais permet également d'économiser le temps perdu à trouver le site Web et à essayer les étapes une par une, et évite également le coût de l'apprentissage de VBA.

Principe de la méthode

Cet article résume les fonctions de base requises pour la manipulation de tables dans un ensemble d'API virtuelles (appelées opérations atomiques, voir la figure ci-dessous), qui sont utilisées pour générer des solutions et servent de pont entre le LLM et le logiciel d'application. .

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

La méthode la plus simple consiste à générer toutes les étapes d'une tâche avec une requête à LLM. Cependant, à mesure que la complexité de la tâche augmente, les étapes suivantes deviennent plus dépendantes des résultats d’exécution des étapes précédentes, ce qui rend difficile l’obtention de résultats corrects par ce contrôle en boucle ouverte. Par exemple, LLM a du mal à déterminer la portée d’une opération s’il ne peut pas déterminer où les données seront visibles après le filtrage.

Afin d'obtenir un contrôle efficace en boucle fermée, SheetCopilot optimise les solutions basées sur le retour d'information sur l'état du logiciel et la base de connaissances externe sur les opérations atomiques, améliorant ainsi le taux de réussite et l'efficacité.

Comment évaluer

Cet article propose un référentiel d'évaluation de haute qualité. Les tâches de ce benchmark ont ​​des formulations diverses et impliquent de riches opérations atomiques, comme le montre le nuage de mots ci-dessous :

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Ce benchmark utilise les mesures suivantes concernant le taux de réussite (plus le niveau est élevé, mieux c'est) :

  • Exec @1 : le taux de réussite de l'exécution de la solution de tâche générée.
  • Pass@1 : taux de réussite de la tâche, c'est-à-dire la proportion de solutions pouvant correspondre à n'importe quelle réponse de référence après exécution.

Ce benchmark prend également en compte les mesures d'efficacité suivantes (le plus bas est le mieux) :

  • A50 : Divisez le nombre d'étapes pour une solution qui répond aux exigences de la tâche par le nombre minimum d'étapes pour la réponse de référence, puis prenez la médiane de tous les résultats de calcul.
  • A90 : La méthode de calcul est la même que ci-dessus, mais le 90e percentile de tous les résultats de calcul est pris en compte. Cet indicateur reflète la répartition des valeurs extrêmes du nombre d'actions.

Résultats expérimentaux

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

Tableau 1 : Comparaison de GPT-3.5-Turbo, GPT-4, Claude et méthodes de génération de VBA sur l'ensemble de données SheetCopilot.

Sans surprise, GPT-4 a la plus grande proportion de solutions qui répondent aux exigences de la tâche et a la meilleure efficacité, tandis que GPT-3.5-Turbo suit de près, et Claude se classe au dernier rang mais est également proche de GPT-3.5- Turbo.

Un résultat remarquable est que, comparé à la méthode de traduction des instructions utilisateur en code VBA et de leur exécution sur Excel, SheetCopilot a obtenu un excellent taux de réussite. Cela signifie que SheetCopilot nous rapproche encore plus du contrôle intelligent logiciel, permettant aux utilisateurs qui ne peuvent pas programmer pour commander des ordinateurs d'effectuer des tâches complexes via une communication quotidienne.

Jetons un coup d'œil aux avantages et inconvénients de chacun de ces trois LLM à travers les indicateurs de chaque catégorie de subdivision ci-dessous.

Gérez les demandes et utilisez de grands modèles pour résoudre les problèmes : Sheet, lartefact de traitement des graphiques, est en ligne.

GPT-3.5 et GPT-4 ont facilement résolu les deux types de tâches : Gestion (tri, filtrage et autres opérations de gestion de tables) et Saisie et manipulation (saisie et manipulation de données), atteignant toutes deux 100 % Taux d'exécution. De plus, les trois LLM ont chacun montré la meilleure efficacité dans différentes catégories de tâches. Cette découverte intéressante montre que chaque LLM a ses avantages uniques et que GPT-4 ne peut pas surpasser les autres modèles.

Conclusion

SheetCopilot utilise LLM pour former avec succès une boucle fermée de perception, de raisonnement et de prise de décision via des interfaces textuelles, obtenant un contrôle efficace des feuilles de calcul, promouvant le contrôle logiciel intelligent à un niveau supérieur et fournissant également une plate-forme pour les personnes intéressées. chez les agents généralistes, les chercheurs ont apporté une nouvelle inspiration.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer