Maison >Périphériques technologiques >IA >L'équipe de Tian Yuandong a sorti la deuxième version du DOC de « Long Story Generator » : la cohérence a été grandement améliorée, et le plaisir a augmenté de 20,7 % !
Il y a quelque temps, l'équipe du Dr Tian Yuandong a publié un cadre de générateur d'histoires Re3 (Recursive Reprompting and Revision) basé sur un modèle de langage à grande échelle lors de l'EMNLP2022. En concevant des invites, le modèle peut générer des histoires cohérentes sans avoir besoin d'affiner. Ajustez le grand modèle. Des histoires allant jusqu’à 7 500 mots peuvent être générées.
Récemment, l'équipe d'auteurs de Re3 a publié la deuxième version du cadre de génération d'histoires longuesDOC (Detailed Outline Control), qui utilise un plan hiérarchique pour décrire l'histoire plus en détail et utilise un OPT affiné. -Le modèle 350m effectue une continuation plus cohérente du contenu généré. En revanche, les évaluations humaines ont évalué DOC comme plus capable d'écrire que la génération précédente Re3.
Lien papier : https://arxiv.org/abs/2212.10077
Lien papier : https://github.com/yangkevin2/doc-story-generation
DOC est composé de deux éléments complémentaires :
1. Outliner détailléCréer un plan plus détaillé et structuré de manière hiérarchique qui sépare le travail créatif du processus de rédaction principal. Passer à l'étape de planification
2. contrôleur garantit que des plans plus détaillés peuvent toujours jouer un rôle dans le processus de génération en contrôlant les paragraphes de l'histoire pour qu'ils soient cohérents avec les détails du plan.
Dans l'évaluation humaine des histoires générées automatiquement, DOC a réalisé un gain absolu de 22,5 % en cohérence de l'intrigue, une augmentation de 28,2 % en pertinence des grandes lignes et une augmentation de 20,7 % en intérêt, ce qui était nettement meilleur que la référence Re3 précédente. modèle, et les évaluateurs humains pensent également que DOC est plus facile à contrôler dans un environnement de production interactif.
Kevin Yang, le premier auteur de l'article, est un doctorant de quatrième année à l'Université de Californie à Berkeley. Son principal intérêt de recherche est la génération de texte en langage naturel contrôlable dans des contextes structurés, comme l'utilisation de méthodes structurées de contrôle. génération pour améliorer la cohérence textuelle du texte.
Le deuxième auteur, le Dr Tian Yuandong, est chercheur et cadre supérieur au Meta Artificial Intelligence Research Institute. Ses intérêts de recherche incluent l'apprentissage par renforcement profond et son application dans les jeux, ainsi que l'analyse théorique des modèles d'apprentissage profond. Il a obtenu sa licence et sa maîtrise à l'Université Jiao Tong de Shanghai en 2005 et 2008, et son doctorat à l'Institut de robotique de l'Université Carnegie Mellon aux États-Unis en 2013.
DOC FrameworkAvec le développement continu de la technologie du langage naturel, la compréhension des textes courts par des modèles linguistiques à grande échelle se rapproche progressivement du goulot d'étranglement, et les gens s'intéressent progressivement à la génération de textes plus longs, par exemple en générant des milliers de mots à la fois.
Par rapport aux tâches de génération de texte court, le texte long contient également plus de contenu et de restrictions. Le modèle doit maintenir une cohérence globale, une cohérence factuelle à long terme, et également maintenir sa pertinence par rapport à la prémisse ou au plan de sortie de l'utilisateur.
Par rapport aux humains, les systèmes de génération d'histoires comme Re3 présentent encore des lacunes sur de nombreux aspects, comme l'incapacité de garantir la cohérence de l'intrigue sur de longues distances, des incohérences globales, un contenu de l'histoire s'écartant du plan établi, etc.
Pour combler cette lacune, le cadre de contrôle des grandes lignes détaillées (DOC) améliore la cohérence à long terme grâce à deux approches complémentaires tout en réutilisant la structure de planification-rédaction-révision de haut niveau de Re3.
Tout d'abord, le plan détaillé affine un court plan initial en un plan hiérarchique plus détaillé. La raison de cette conception est que les auteurs humains peuvent rédiger un long document avant de l'affiner et de l'étendre de manière itérative. un bref aperçu initial.
Plutôt que d'improviser de nouveaux points d'intrigue, un écrivain peut planifier une intrigue globale cohérente au stade de l'esquisse de haut niveau, en utilisant un aperçu élargi pour fournir des conseils plus détaillés pendant le processus de rédaction.
Au cours de la phase de rédaction, les chercheurs ont réutilisé la réorganisation de la pertinence du plan et de la cohérence du texte de l'étape de réécriture Re3 pour détecter quand le projet de plan en cours a terminé un paragraphe d'article et obtenir un arrêt précoce en fonction du seuil de score.
Il y a des paramètres complets et des caractères pertinents dans le plan, et chaque élément du plan est soigneusement examiné pour sa pertinence et sa cohérence dans son contexte.
Dans l'invite structurée, le modèle met en évidence les paramètres actuels, les modifications apportées aux paramètres et récupère également les descriptions de rôle en fonction des rôles détectés dans le plan.
En revanche, Re3 sélectionne dynamiquement les personnages pertinents pour chaque segment pendant le processus de rédaction et ne suit pas les informations de configuration, ce qui peut entraîner des changements inattendus dans la configuration de l'histoire
Le deuxième Le composant, le contrôleur détaillé, maintient la fidélité au plan détaillé en contrôlant la génération de paragraphes en fonction des éléments de plan correspondants.
Étant donné que le plan détaillé impose de nombreuses contraintes souples qui se chevauchent, le contrôleur détaillé doit exercer une force de contrôle suffisante. Dans le même temps, le contrôleur détaillé doit également s'adapter à une saisie flexible en langage naturel et être généré lors de l'utilisation de l'état de l'art. des modèles de langage artistiques à grande échelle.
Les chercheurs ont donc implémenté le contrôleur détaillé en tant que contrôleur basé sur OPT350m et ont conçu un programme de formation contrasté pour aligner le résumé sur le préfixe du paragraphe.
Plus important encore, les chercheurs ont également construit de nombreux négatifs durs et fluides pour que les paragraphes générés soient pertinents non seulement par rapport au sujet au début, mais également tout au long.
Dans l'expérience, l'entrée dans le modèle n'est qu'une courte prémisse en anglais, généralement de 30 à 60 mots, et la sortie est une histoire complète.
Les chercheurs n'ont pas imposé plus de contraintes réglementaires car la définition de « histoire » n'est pas encore claire, encore moins la définition de « bonne histoire », et la qualité repose principalement sur des indicateurs d'évaluation manuels.
utilise principalement trois indicateurs en évaluation, qui sont plus adaptés pour comparer des paragraphes plutôt que des histoires complètes :
1 Cohérence, le pourcentage de paragraphes où les annotateurs humains jugent que l'intrigue est cohérente ; 2 .
Pertinence, le pourcentage de paragraphes jugés conformes à l'entrée de plan correspondante ; 3
Intérêt, le pourcentage de paragraphes jugés intéressants. Les modèles de base comparés incluent Re3, ROLLING-OPT et ROLLING-GPT.
Comme le montrent les résultats expérimentaux, par rapport à Re3, les annotateurs estiment que le tracé généré par DOC est plus cohérent, plus pertinent par rapport au plan et présente une amélioration plus élevée que la ligne de base ROLLING.
Et les résultats confirment l'exactitude de la conception du modèle, c'est-à-dire que la cohérence de l'intrigue et la pertinence des contours bénéficient du déplacement du travail créatif de la planification à la rédaction, ainsi que de mécanismes de contrôle améliorés.
Et étonnamment, les annotateurs pensaient également que les paragraphes DOC étaient significativement plus intéressants. Les chercheurs pensaient qu'il s'agissait d'une amélioration apportée par les contours plus détaillés (plus basés sur les événements). D'autres expériences d'ablation ont également soutenu cette hypothèse.
Cependant, l'analyse qualitative a également révélé que le modèle dispose encore d'une énorme marge d'amélioration.
Contrairement à RE3, DOC ne s'écarte généralement pas de manière significative du plan de niveau supérieur, tandis que RE3 s'éloigne parfois presque complètement du sujet, mais DOC ne parvient souvent pas à suivre les parties de niveau inférieur du plan détaillé.
Il existe encore des problèmes de cohérence interne dans DOC et RE3, et des erreurs occasionnelles dans les grandes lignes détaillées peuvent avoir un impact particulièrement négatif, conduisant à des erreurs en cascade plus importantes au cours du processus de rédaction.
De plus, les grandes lignes du DOC sont souvent incohérentes en termes de niveau de détail, certaines étant trop vagues et d'autres semblant trop développées.
De plus, les paramètres et les personnages détectés par le modèle peuvent parfois être incorrects ou incomplets, et l'exemple ci-dessous montre une histoire fortement abrégée écrite par DOC sur la base du plan ci-dessus.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!