Maison >Périphériques technologiques >IA >L'intelligence artificielle peut-elle faire preuve de créativité comme les humains ?
La créativité est une capacité humaine unique qui nous permet de créer des œuvres nouvelles, précieuses et significatives, telles que l'art, la littérature, la science, la technologie, etc. La créativité est également un moteur important dans la société humaine. Elle favorise le développement et le progrès dans les domaines de la culture, de l’économie, de l’éducation et dans d’autres domaines. Qu’est-ce que la créativité exactement ? Comment est-ce arrivé ? Comment est-il évalué et amélioré ? Ces questions laissent perplexes les chercheurs de plusieurs disciplines, notamment les psychologues, les spécialistes des sciences cognitives et les philosophes. Avec le développement rapide de la technologie de l’intelligence artificielle (IA), ces questions ont également attiré l’attention dans le domaine de l’IA. L’IA peut-elle être aussi créative que les humains ? Si oui, comment définir, mesurer et cultiver la créativité de l’IA ? Ces questions ont non seulement une signification théorique, mais aussi une valeur pratique, car la créativité de l’IA affectera son application et son développement dans divers domaines.
Le forum universitaire des sciences et technologies arxiv.org a publié le dernier article « L'IA peut-elle être aussi créative que les humains ? » Le 3 janvier, l'article a été rédigé par de nombreux chercheurs renommés en IA des États-Unis, de Grande-Bretagne et de Singapour. et d'autres pays. Co-écrit par deux collègues, cet article est une exploration approfondie de la créativité de l'IA. Il propose un nouveau paradigme d'évaluation de la créativité, à savoir la créativité relative (Relative Creativity), et établit un cadre de créativité quantifiable, à savoir les statistiques. La créativité. Le document fait non seulement progresser les discussions théoriques, mais fournit également des outils et des méthodes pratiques pour évaluer et améliorer le potentiel créatif de l’IA. Les principales contributions et innovations de cet article sont les suivantes :
propose le concept de créativité relative, transformant l'évaluation de la créativité des systèmes d'IA d'une norme absolue à une comparaison avec un créateur humain spécifique, reconnaissant ainsi cela dans le processus créatif subjectivité inhérente et s’appuie sur la méthode comparative d’évaluation de l’intelligence du test de Turing. Cette approche innovante compare la créativité de l’IA à la créativité humaine, nous permettant de mieux comprendre les performances et les capacités des systèmes d’IA dans le processus créatif. En intégrant la subjectivité dans le système d'évaluation, nous sommes en mesure d'évaluer plus complètement la créativité des systèmes d'IA et de les comparer aux créateurs humains, ce qui la rend plus
Pour évaluer la créativité de l'IA, le concept de créativité statistique est introduit, un méthode qui combine construction théorique et évaluation empirique. Cette méthode se concentre sur la question de savoir si l’IA peut imiter la production créative d’un groupe spécifique de personnes, évaluant ainsi quantitativement la créativité de l’IA et améliorant l’applicabilité pratique du cadre théorique.
L'application de la créativité statistique aux modèles autorégressifs est une technique de modélisation du langage largement utilisée. Cette technique est considérée comme quelque peu créative et dispose d’une métrique pratique pour évaluer la créativité statistique d’un modèle. En particulier lorsqu’il s’agit de prédiction de la prochaine marque, cette mesure est adaptable aux besoins des modèles d’IA contemporains et montre le potentiel de suivre le rythme des progrès technologiques.
La recherche introduit une fonction objective appelée Perte de créativité statistique pour former des modèles d'IA créatifs. L'étude analyse également la limite supérieure de la perte de créativité statistique et ses concepts liés à la généralisation dans l'apprentissage profond, tels que la complexité de Rademacher, l'information mutuelle et le nombre de couverture ε. Ces conseils théoriques et mesures pratiques fournissent une aide importante pour développer la capacité créative des modèles d’IA.
La créativité est une capacité difficile à définir et à mesurer car elle implique des facteurs subjectifs, situationnels, multidimensionnels et dynamiques. Il peut y avoir différents points de vue et normes sur ce qu’est la créativité et ce qu’est le travail créatif. Il est donc irréaliste et injuste de donner une définition absolue de la créativité ou de donner une évaluation absolue de la créativité aux systèmes d’IA. L'auteur estime que l'évaluation de la créativité doit être relative et non absolue, c'est-à-dire que la créativité des systèmes d'IA doit être comparée en fonction des niveaux et des caractéristiques des différents créateurs humains. De cette manière, l’évaluation de la créativité n’est plus une norme statique, fixe et unique, mais un processus dynamique, flexible et diversifié qui peut mieux refléter la nature et la diversité de la créativité.
L'auteur a proposé le concept de créativité relative (Relative Creativity), en le définissant comme suit : un système d'IA est considéré comme relativement créatif s'il peut générer des informations similaires à celles d'un créateur humain donné sur la base des informations biographiques du créateur. Si l'œuvre est impossible à distinguer, alors le système d'IA peut être considéré comme aussi créatif que ce créateur. La « relativité » de la créativité relative se reflète dans le fait qu'elle dépend des différences entre les individus comparés. Par exemple, un système d’IA peut paraître très créatif par rapport à un créateur humain non expert, mais moins créatif par rapport à un designer ou un artiste expert. La créativité relative reconnaît également la subjectivité de la créativité, telle que l'originalité, la pensée divergente et les compétences en résolution de problèmes, qui sont intégrées au processus de sélection qui ancre les créateurs humains. Puisque l'évaluation de la créativité est basée sur une perspective humaine, le concept de créativité relative s'inspire également du test de Turing, une méthode comparative d'évaluation de l'intelligence de l'IA en jugeant si un système d'IA peut rivaliser avec les humains.
Photos
Figure 1 : Illustration de la créativité relative et de la créativité statistique. Dans la figure 1, nous expliquons la créativité relative (a) et la créativité statistique (b). La créativité relative fait référence à une évaluation de la capacité d'une IA à créer un art qui est pratiquement impossible à distinguer d'un hypothétique créateur humain, en tenant compte des mêmes influences biographiques. La créativité statistique, quant à elle, est évaluée en mesurant la capacité des créations générées par l’IA à ne pas se distinguer des créateurs humains existants, telle que déterminée par une mesure de distance de distribution.
La créativité relative présente certaines similitudes avec le test de Turing, mais il existe également quelques différences. La similitude est qu'ils sont tous basés sur une perspective humaine et évaluent les capacités du système d'IA en comparant les performances du système d'IA avec celles des humains. La différence est que le but du test de Turing est d’évaluer l’intelligence d’un système d’IA, tandis que le but de la créativité relative est d’évaluer la créativité d’un système d’IA. L’intelligence et la créativité sont deux dimensions différentes qui peuvent se chevaucher mais aussi présenter certaines différences. Par exemple, un système d’IA peut être intelligent mais pas nécessairement créatif, et vice versa. Une autre différence est que l'évaluation du test de Turing est basée sur la conversation, tandis que l'évaluation de la créativité relative est basée sur le travail. Le dialogue est un processus interactif, dynamique et en temps réel, tandis que le travail est un résultat statique, fixe et différé. Par conséquent, l’évaluation de la créativité relative peut être plus difficile car elle nécessite de prendre en compte davantage de facteurs, tels que le style, le contenu, la qualité, l’originalité, etc. de l’œuvre. L'auteur estime que la créativité relative est une méthode d'évaluation de la créativité plus complète et plus approfondie, qui prend en compte non seulement les performances du système d'IA, mais également l'expérience et les caractéristiques du créateur humain.
Bien que le concept de créativité relative soit éclairant, il lui manque encore une méthode d'évaluation opérationnelle. Afin de combler cette lacune, l'auteur introduit le concept de créativité statistique (Statistical Creativity), qui se définit comme suit : un système d'IA est considéré comme statistiquement créatif s'il peut générer, étant donné un groupe de créateurs humains, un Output qui ne se distingue pas de la production créative du groupe, alors le système d'IA peut être considéré comme aussi créatif que le groupe. La nature « statistique » de la créativité statistique se reflète dans le fait qu’elle évalue la créativité des systèmes d’IA sur la base de données observables plutôt que de normes abstraites.
Pictures
L'auteur a proposé une mesure de la créativité statistique, à savoir E0(q), qui est une mesure empirique utilisée pour estimer la différence entre les capacités créatives d'un modèle d'IA et l'indiscernabilité d'un groupe de créateurs humains. . Plus la valeur de E0(q) est faible, plus le modèle d'IA est capable d'imiter la capacité créative du groupe. L'auteur donne également un théorème de créativité statistique, clarifiant les conditions dans lesquelles un modèle d'IA peut être classé comme ayant une δ-créativité, c'est-à-dire E0(q)
Les modèles autorégressifs sont une technique courante de grands modèles linguistiques (LLM) qui génère un texte cohérent en prédisant le prochain jeton en fonction de la séquence de texte de distribution de probabilité précédente. Les modèles autorégressifs sont considérés comme ayant un certain degré de créativité en raison de leur capacité à générer des textes nouveaux tels que des poèmes, des histoires, des codes, etc. Cependant, la question de savoir comment évaluer et améliorer la créativité des modèles autorégressifs reste ouverte. Les auteurs appliquent le concept de créativité statistique aux modèles autorégressifs et proposent une mesure de créativité statistique pour la prochaine prédiction symbolique, à savoir E1(q), qui est une mesure empirique utilisée pour estimer un modèle autorégressif et une indiscernabilité entre les capacités créatives de groupes de personnes. créateurs humains. Plus la valeur de E1(q) est faible, plus le modèle autorégressif est capable d’imiter la capacité créatrice du groupe.
Photos
L'auteur a également donné un théorème pour la créativité statistique d'un modèle autorégressif, clarifiant les conditions dans lesquelles un modèle autorégressif peut être classé comme ayant une créativité delta, c'est-à-dire E1(q) < ; δ, et nous disposons d’un ensemble d’échantillons suffisamment grand pour l’évaluation. Ce théorème donne non seulement une méthode de classification de la créativité, mais donne également un degré de créativité, à savoir δ, qui représente la différence entre le modèle autorégressif et la capacité créatrice d'un groupe de créateurs humains. L’affirmation des auteurs est simple : si un modèle autorégressif peut générer des séquences (telles que des poèmes ou des histoires) similaires au travail d’un groupe d’artistes humains, alors il présente un niveau de créativité comparable à celui de ce groupe. Pour quantifier cette évaluation, les auteurs introduisent la métrique E1(q).
La prédiction du prochain jeton est la technologie de base des modèles autorégressifs, qui détermine la qualité et la diversité des séquences de texte générées par le modèle. La difficulté de la prédiction du prochain jeton dépend du contexte donné et de la probabilité du jeton de la cible. Si le contexte est clair et spécifique, il est alors plus facile de prédire le prochain jeton car certains jetons sont plus raisonnables et courants. Par exemple, si le contexte est « J'aime manger », alors la balise suivante pourrait être « pomme », « pain », « dumplings », etc. Cependant, si le contexte est vague et abstrait, la prédiction du prochain jeton est alors plus difficile car de nombreux jetons sont possibles sans avantage clair. Par exemple, si le contexte est « Je veux », alors la balise suivante pourrait être « voyage », « étudier », « dormir », etc. Dans ce cas, le modèle autorégressif nécessite une plus grande créativité pour générer des séquences de texte significatives et intéressantes.
L'importance de la prochaine prédiction de balise est qu'elle reflète le niveau de créativité du modèle autorégressif et sa similitude avec la créativité des créateurs humains. Un modèle autorégressif présente la même créativité qu'un créateur humain s'il peut générer le prochain jeton impossible à distinguer du travail d'un créateur humain dans un contexte différent. Cette évaluation de la créativité peut être réalisée à travers des mesures de créativité statistique, telles que E1(q). L'auteur estime que cette méthode d'évaluation est une méthode plus objective et scientifique qui ne repose pas sur le jugement subjectif humain mais est basée sur le calcul de données et de probabilités. Les recherches de l'auteur fournissent une nouvelle perspective et une nouvelle méthode pour la créativité des modèles autorégressifs, ce qui contribue à améliorer la capacité de génération et la qualité du modèle.
Les grands modèles de langage conditionnés par des invites (LLM) sont un paradigme de modèle de pointe qui peut tirer parti des invites (invites) ) pour libérer le potentiel capacités du modèle. Les indices sont une méthode permettant de fournir des formats d'entrée et de sortie au modèle, qui peuvent être utilisés pour guider le modèle dans l'exécution de différentes tâches, telles que la classification de texte, la génération de texte, le résumé de texte, etc. Les invites fonctionnent de manière similaire aux heuristiques humaines, stimulant la créativité et la flexibilité des modèles. Cependant, comment évaluer et améliorer la créativité des LLM basés sur des invites reste une question ouverte. Les auteurs appliquent le concept de créativité statistique aux LLM basés sur des signaux et proposent une mesure de la créativité statistique pour différents signaux contextuels, à savoir E2(q), qui est une mesure empirique utilisée pour estimer un LLM basé sur des signaux et l'indiscernabilité du LLM. capacités créatives d’une communauté de créateurs humains. Plus la valeur de E2(q) est faible, plus le LLM basé sur des invites est capable d'imiter la capacité créative du groupe. L'auteur donne également une inférence sur la créativité statistique d'un LLM basé sur des invites, clarifiant les conditions dans lesquelles un LLM basé sur des invites peut être classé comme ayant une δ-créativité, c'est-à-dire E2(q)
La perte de créativité statistique (Statistical Creativity Loss) est une fonction objective optimisable utilisée pour entraîner des modèles d'IA créatifs. Il est défini à partir de mesures de créativité statistique, telles que E0(q), E1(q) ou E2(q). Plus la valeur de la perte statistique de créativité est faible, plus le modèle d'IA est capable d'imiter la capacité créative d'un groupe de créateurs humains. Les auteurs proposent une limite supérieure pour la perte de créativité statistique, la formule (2), et ses concepts liés à la généralisation dans l'apprentissage profond, tels que la complexité de Rademacher, l'information mutuelle et le nombre ε-couvrant (numéro ε-couvrant), etc. Les auteurs analysent la limite supérieure de la perte de créativité statistique en fonction de la log-vraisemblance de la prochaine prédiction symbolique et de la quantité de données de production du créateur requise pour atteindre la créativité statistique. Les conclusions des auteurs soulignent l’importance de la diversité dans les couples créateur-œuvre, plutôt que de simplement disposer de grandes quantités de données sur la création. Cette idée rend le concept de créativité statistique particulièrement applicable dans les cadres d’IA actuels basés sur la prédiction de la prochaine marque. Les recherches de l'auteur fournissent non seulement une perspective théorique, mais guident également la discussion sur la créativité de l'IA, préconisent l'utilisation de l'évaluation relative pour promouvoir la recherche empirique et établissent un cadre pour évaluer et améliorer la capacité créative des modèles d'IA.
L'auteur passe enfin en revue les travaux antérieurs connexes sur la définition et l'application de la créativité, impliquant principalement les deux domaines de la vision et du langage. Les auteurs notent que même si de nombreuses études tentent d’appliquer des éléments de créativité dans des modèles génératifs, aucune ne définit directement la créativité ni ne l’optimise directement. Les recherches des auteurs visent plutôt à construire une base théorique pour la créativité, un cadre qui intègre naturellement les connaissances antérieures sur la diversité et la qualité de la génération. Les auteurs espèrent que leurs contributions jetteront les bases de recherches futures et guideront l’amélioration de la créativité des modèles.
Dans le domaine de la vision, les modèles de génération d'images créatives ont fait des progrès significatifs, soulevant la question de savoir si les machines peuvent produire de l'art créatif. Hertzmann (2018) explore cette question en profondeur, mettant en évidence l’intersection entre l’infographie et l’innovation artistique. Xu et al. (2012a) ont proposé une méthode de modélisation tridimensionnelle créative capable de générer divers modèles en fonction des préférences de l'utilisateur. Les réseaux contradictoires génératifs (GAN) (Goodfellow et al., 2014) ont été utilisés par Elgammal et al. (2017) pour stimuler la création de styles artistiques uniques en maximisant les écarts par rapport aux styles connus. Sbai et al. (2018) augmentent encore ce biais, encourageant le modèle à être d'un style différent de celui de l'ensemble d'entraînement. La génération créative peut également être considérée comme un processus combinatoire, Ge et al. (2021) et Ranaweera (2016) soulignant l'importance de l'intégration d'éléments détaillés. Sur cette base, Vinker et al. (2023) ont décomposé le concept de personnalisation en éléments visuels pour une réorganisation innovante, enrichissant la production créative.
Dans le domaine du langage, le développement de modèles linguistiques a également incité les chercheurs à explorer comment optimiser l'utilisation des données pour améliorer l'adaptabilité des modèles dans différents domaines, tâches et langages (Gururangan et al., 2020 ; Devlin et al., 2019 ; Conneau et al., 2020). Les chercheurs ont également montré une tendance à utiliser des modèles linguistiques pour interpréter les nuances de la communication humaine (Schwartz et al., 2013 ; Wu et al., 2022). Ces informations ont également été utilisées pour améliorer les modèles de classification (Hovy, 2015 ; Flek, 2020). Avec la popularité croissante des modèles génératifs, les gens s'intéressent également à la génération de texte contrôlable, c'est-à-dire que la sortie du modèle doit satisfaire certaines contraintes, telles que la politesse (Saha et al., 2022 ; Sennrich et al., 2016), l'émotion. (Liu et al., 2016) al., 2021 ; Dathathri et al., 2019 ; He et al., 2020) ou d'autres contraintes de style. Enfin, le transfert de style de texte (TST), qui convertit le style du texte saisi en un style cible défini, est également devenu une tâche populaire. Le style peut faire référence à une gamme de différentes caractéristiques spécifiques au texte et à l'auteur, telles que la politesse (Madaan et al., 2020), la formalité (Rao et Tetreault, 2018 ; Briakou et al., 2021), la simplicité (Zhu et al. , 2021) 2010 ; van den Bercken et al., 2019 ; Weng et al., 2019 ; Cao et al., 2020), auteur (Xu et al., 2012b ; Carlson et al., 2018), sexe de l'auteur (Prabhumoye et al., 2018) et ainsi de suite (Jin et al., 2022). Bien que toutes ces applications tentent d’appliquer des éléments de créativité dans des modèles génératifs, aucune ne définit directement la créativité ni ne l’optimise directement. Au lieu de cela, ils se concentrent sur l’amélioration des performances du modèle sur des tâches prédéfinies en tant que proxy de la créativité. En revanche, les recherches des auteurs visent à établir un fondement théorique pour la créativité. Ce cadre intègre naturellement les connaissances antérieures sur la diversité et la qualité de la génération. Les auteurs espèrent que leurs contributions jetteront les bases de recherches futures et guideront l’amélioration de la créativité des modèles.
Référence : https://arxiv.org/abs/2401.01623
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!