Maison >Périphériques technologiques >IA >Après avoir lu les dissertations de l'examen d'entrée à l'université auxquelles ont répondu les grands modèles, je peux relâcher mon plaidoyer et ma peur de l'IA.
Article|Chapitre adjacent
L'utilisation d'outils d'IA pour la création littéraire a toujours été quelque chose que les entreprises technologiques sont prêtes à essayer, en particulier à des moments particuliers tels que « l'examen d'entrée à l'université » qui attire l'attention nationale, l'utilisation de l'IA pour rédiger des essais d'examen d'entrée à l'université est encore plus. recherché par les entreprises technologiques.
Cette année, les combats ouverts et secrets seront encore pires qu'avant.
La raison principale est, bien sûr, que depuis l’année dernière, l’application d’IA générative ChatGPT d’Open AI a presque qualitativement modifié ses capacités, déclenchant une frénésie mondiale pour les grands modèles d’IA générative, faisant reconnaître à tout le monde que la technologie de l’IA a atteint le moment « iPhone ».
Les sociétés nationales de technologie et d'Internet ont également emboîté le pas et ont lancé cette année leurs propres produits de grands modèles d'IA générative - selon des statistiques incomplètes : depuis février de cette année, il y a eu près de 20 conférences nationales sur de grands modèles d'IA. Par exemple, Baidu Wenxinyiyan, Alibaba. Tongyi Qianwen, iFlytek Spark Model, etc., prétendent tous presque au monde extérieur que la technologie de leurs produits est à la pointe.
Ici, « College Entry Examination Essay », une question de test complète qui teste de manière exhaustive la capacité de compréhension matérielle, les compétences rédactionnelles, la capacité de pensée critique et la capacité d'innovation rédactionnelle des candidats, est sans aucun doute une pierre de touche pour tester les capacités de création technologique de divers grands- des maquettes.
C'est précisément sur cette base que les fabricants qui se consacrent aux modèles d'IA générative à grande échelle se préparent également à montrer les capacités de création littéraire de leurs propres modèles d'IA générative à grande échelle.
Par exemple, Zhou Hongyi a partagé un essai sur l'examen national d'entrée à l'université de cette année rédigé par 360 Intelligent Brain sur Weibo.
Mais à en juger par les résultats finaux, ses performances sont bonnes dans les compétences de base mais insuffisantes au niveau critique, et il est difficile d'obtenir des scores élevés.
Wang Daji, un professeur spécial de langue chinoise, a commenté l'essai d'IA généré par 360 Intelligent Brain sur Weibo : « L'essai a un langage clair, des niveaux clairs et de bonnes compétences rédactionnelles de base. Il fonctionne bien au niveau de base. L'essai parle également de haute technologie, mais dans les conditions du développement scientifique et technologique, pourquoi devrions-nous être le maître du temps, mais pourquoi sommes-nous devenus le serviteur du temps ? Nous n'avons pas réussi à saisir la clé et n'avons pas réfléchi suffisamment en profondeur ? . Par conséquent, nous n'avons pas fait une analyse approfondie. Le sens des temps requis par le titre est relativement indifférent, et dans le développement En termes de niveau, la performance est moyenne.
En fait, ce manque de pensée spéculative au niveau de la création littéraire ne se limite pas à l'intelligence 360. En fait, c'est presque un « problème courant » dans les modèles d'IA générative à grande échelle actuels.Dans Sohu Technology, nous avons mené une étude sur cinq grands produits de modèles de langage grand public, Baidu Wenxinyiyan, Alibaba Tongyi Qianwen, iFlytek Spark Cognitive Large Model, 360 Intelligent Brain et ChatGPT, sur la base du papier d'essai de l'examen national d'entrée à l'université (A). Nous avons testé le même sujet et invité cinq professeurs de langue chinoise célèbres à commenter le niveau de composition généré par chaque modèle. Il n'est pas difficile de constater que : les cinq principaux modèles ont essentiellement compris le concept de composition de l'examen d'entrée à l'université nationale. A), et il n'y a pas eu de questions hors sujet ou même si le sujet s'écarte du sujet, les articles correspondants peuvent être générés en peu de temps.
Mais en même temps, les grands modèles ont également une compréhension floue des exigences spécifiques en matière de composition (par exemple, le nombre de mots dans les articles qu'ils créent ne répond pas à l'exigence d'au moins 800 mots), l'écriture est rigide, le sentiment de fragmentation est évident, le langage est vide et la « saveur scientifique et technique » est évidente ; et plus important encore, les articles qu'ils créent souffrent généralement des problèmes les plus fatals de la création littéraire, tels qu'un manque d'arguments et de justifications ; , et des points de vue peu originaux. Cela conduit également aux essais d'examen d'entrée à l'université créés par ces cinq grands modèles, ChatGPT a le score global le plus élevé et n'a obtenu que 48 points.
Pour être honnête, les 48 points de ChatGPT et les 46,5 points de Baidu Wenxinyiyan ne sont en fait pas bas dans les notes de dissertation de l'examen d'entrée à l'université. Ils peuvent même dépasser les notes de dissertation de nombreux candidats, mais ils ne sont pas incomparables avec d'excellents dissertations, on peut seulement le dire. être un niveau relativement ordinaire.
Les problèmes exposés par ces grands modèles de création littéraire nous permettent également de constater les lacunes de la technologie actuelle d'IA générative. On peut même dire que ceux qui prétendent que les technologies d'IA générative telles que ChatGPT peuvent désormais réaliser la création littéraire et remplacer les mots. du personnel étaient en effet exagérés, voire alarmistes.
Bien sûr, nous ne nions pas le potentiel des technologies d'IA générative telles que ChatGPT à se développer rapidement avec une alimentation continue. Cependant, il n'est peut-être pas possible pour les grands modèles de se débarrasser du manque actuel de créativité dans la création littéraire des grands modèles. Ce qui peut être fait peut prendre plus de temps.
Ici, on peut presque dire : après avoir lu des dissertations d'examen d'entrée à l'université qui utilisent l'IA générative pour répondre aux questions, je pense que qu'il s'agisse de préconiser ou de craindre que l'IA remplace la création littéraire, nous pouvons en fait la mettre de côté pour le moment.
ChatGPT et d'autres technologies de grand modèle ont les capacités de rédaction d'e-mails, d'actualités et de papier, de script vidéo, de rédaction, de traduction, d'écriture de code, etc., permettant à la technologie d'IA générative de surpasser largement la nature orientée divertissement de ce type d'application d'IA dans le passé. Entrer dans la véritable étape de la productivité et même de la création.
En conséquence, de nombreuses personnes dans l'industrie se sont exclamées : les opportunités d'emploi créatives pourraient d'abord être remplacées par GPT, et elles ont commencé à tomber dans des attentes pessimistes.
En fait, mon point de vue sur la force de la technologie de l'IA générative a toujours été le suivant : il n'est pas nécessaire de faire une promotion excessive, et il n'est pas nécessaire d'avoir trop peur. Traitez le développement et les changements technologiques avec un cœur normal, et peut-être. ce sera mieux.
Face à la vague technologique, ce que nous devrions faire davantage, c'est apprendre à faire bon usage de ces technologies le plus tôt possible pour contribuer à améliorer notre efficacité au travail et notre qualité de vie.
Auteur : Lin Zhang [WeChat : ZLxgic, compte public : TMT317], se concentrant sur l'interprétation des tendances de développement de l'industrie et des produits et services de l'entreprise. La numérisation, l’IA, le cloud computing, les rapports financiers des entreprises, le matériel intelligent et l’innovation grand public sont au centre des préoccupations.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!