Maison > Article > Périphériques technologiques > Le premier sommet de haut niveau de l'AIGC en Chine a été un grand événement ! Des milliers de mots d'informations sèches ont discuté de l'ère GPT-4, condensant les discours de 21 experts
Zhixixi a rapporté le 24 mars qu'aujourd'hui, le Sommet de l'innovation GTIC 2023 China AIGC s'est tenu avec succès à Pékin !
Au moment où l'ère GPT-4 s'ouvre, ce sommet, dont le thème est « La nouvelle ère de l'IA crée un nouveau monde », est le premier sommet d'innovation de haut niveau en Chine axé sur l'IA générative (AIGC), réunissant Les leaders de l'industrie, du monde universitaire et de la recherche du Super 20 ont lancé des séries de confrontations techniques féroces et de collisions d'opinions pour aider chaque industriel qui avance dans le brouillard à accomplir un voyage d'élimination des mensonges et de recherche de la vérité.
Trop de questions ont inondé nos cerveaux ces deux derniers mois : GPT-4 provoquera-t-il vraiment une explosion de l'intelligence cognitive ? Quelle est la différence entre notre IA et ChatGPT ? Une version chinoise d’OpenAI va-t-elle naître ? Le MaaS (Model as a Service), fréquemment évoqué par les grands constructeurs, sera-t-il une tendance définitive ? L'industrie chinoise de l'AIGC sera-t-elle une « grande usine gagnante qui remporte tout » ou une « centaine de fleurs qui s'épanouissent »... De nombreuses questions ont trouvé des réponses lors de ce sommet. La plupart des réponses sont différentes de notre intuition irréfléchie, et même les opinions des experts le sont complètement. ci-contre. Cela rend ces discussions extrêmement précieuses.
De la concurrence entre les grands fabricants et les produits de grands modèles à la collision des principales opinions d'investissement en IA, de l'essai de produits pionniers de l'AIGC à l'« esthétique violente » des entreprises de puissance de calcul, du débat « grand modèle contre petit modèle » à "Pourquoi ChatGPT n'est-il pas venu en premier ?" La question de l'âme de "Apparaître en Chine"... vague après vague de sommets, le sommet était rempli de sièges, extrêmement populaire, et l'atmosphère des échanges était plus que animée. un millier de personnes ont assisté à la réunion tout au long de la journée et le nombre de retransmissions en direct sur l'ensemble du réseau s'est élevé à 4,2 millions.
Gong Lunchang, co-fondateur et PDG de Zhiyi Technology, a déclaré lors du sommet au nom de l'organisateur que l'industrie de l'IA inaugure une nouvelle période d'opportunités de marché et que le Sommet chinois de l'innovation AIGC espère construire une plateforme d'échange pour les milieux universitaires, industriels et d'investissement. Ce sommet comprend principalement un forum principal du Forum du sommet de l'AIGC et trois forums thématiques sur les grands modèles, ChatGPT de type chinois et l'innovation des applications AIGC.
Lors de la réunion, des représentants d'institutions universitaires telles que l'Académie chinoise des sciences, des géants de l'industrie tels que Microsoft, Baidu, Kuaishou, Nvidia, Kunlun Wanwei et SenseTime, Lanzhou Technology, Moxin Artificial Intelligence, UBTECH, Zhipu AI et Luchen Des pionniers de l'entrepreneuriat technologique tels que Yunzhisheng, Zhujian Intelligence, aiXcoder, Movie Book Technology et Computational Aesthetics (Nolibox), ainsi que des représentants invités d'institutions d'investissement telles que Qiming Venture Capital, Creation Partners Capital et Lanchi Venture Capital, ont partagé une grande modèles réduits et innovation de pointe, perspectives commerciales, évolution de la puissance de calcul, opportunités entrepreneuriales et stratégies d’investissement de l’IA générative.
Ce qui suit est l’essence du discours du sommet de l’AIGC d’aujourd’hui.
Gong Lunchang, co-fondateur et PDG de Zhiyi Technology, a prononcé un discours pour ce sommet sur au nom de l'organisateur. L'émergence et l'évolution d'algorithmes et de modèles clés tels que les modèles de langage pré-entraînés et les modèles de diffusion ont favorisé le développement rapide de l'IA générative, et les produits associés ont attiré l'attention mondiale en très peu de temps.
▲Gong Lunchang, co-fondateur et PDG de Zhiyi Technology
La semaine dernière a été une période critique pour le développement rapide de l'IA, la sortie de GPT-4 et Wen Xinyiyan, et l'intégration de GPT par Microsoft dans. le compartiment familial des bureaux a fait bondir les outils de production. L'industrie de l'IA inaugure une nouvelle période d'opportunités de marché.
Sur cette base, le China AIGC Innovation Summit espère construire une plate-forme de communication pour les milieux universitaires, industriels et d'investissement, afin que chacun puisse avoir des échanges approfondis, stimuler les idées et promouvoir la mise en œuvre de la coopération et de l'innovation.
Cette année est la 7ème année depuis la création de Zhiyi Technology. Zhiyi Technology adhère à la double roue motrice de la technologie et de l'industrie, se concentre sur les technologies de pointe représentées par la numérisation et l'intelligence et leurs applications industrielles, et construit deux systèmes commerciaux majeurs de médias industriels et de services d'entreprise.
Zhiyi Technology dispose d'une matrice de médias industriels représentée par Zhixi East, Core Dongxi et Car Dongxi. Elle est devenue un média industriel avec un positionnement unique et une grande influence et crédibilité en Chine. , il a développé un cours ouvert avec Zhiyi. En tant que système de services d'entreprise de base, nous coopérons avec des experts et des universitaires d'entreprises industrielles exceptionnelles et des meilleures universités du monde pour organiser une série de conférences et de nouvelles conférences pour les jeunes, et coopérons avec les meilleurs nationaux et étrangers. entreprises pour organiser des cours ouverts personnalisés jusqu'à présent, plus de 600 cours ont été suivis.
Lors du sommet du matin, Zhou Ming, fondateur et PDG de Lanzhou Technology et vice-président du CCF, China Computer Federation , a expliqué comment les grands modèles apportent un nouveau paradigme, Zhang Jiajun, chercheur et directeur de doctorat à l'Institut d'automatisation de l'Académie chinoise des sciences, a expliqué comment le modèle Zidong Taichu comprend les mystères du monde.
Dans le même temps, Xu Mingqiang, directeur de la technologie de la division Microsoft Omni-Channel, a amené tout le monde à explorer les tendances AIGC et l'application des services Microsoft Azure OpenAI dans les entreprises, Yuan Foyu, vice-président du groupe Baidu, qui venait de lancer Wen Xin ; Yi Yan, est venu sur place pour discuter de Wen Xin Yi Yan Comment changer les règles du jeu sur le marché du cloud computing.
1. Zhou Ming de Lanzhou Technology : Les grands modèles entraînent l'essor de l'intelligence cognitive, et neuf aspects majeurs sont concentrés sur
Zhou Ming, fondateur et PDG de Lanzhou Technology, vice-président du CCF de la China Computer Federation, et scientifique en chef d'Innovation Works, a donné une interprétation approfondie du nouveau paradigme apporté par les grands modèles.
▲Zhou Ming, fondateur et PDG de Lanzhou Technology, vice-président du CCF, China Computer Federation, et scientifique en chef d'Innovation Works
En tant qu'expert technique issu de Microsoft, Zhou Ming a déclaré qu'il était profondément Influencé par le cofondateur de Microsoft, Bill Gates, estime que les grands modèles entraînent l'essor de l'intelligence cognitive. Les grands modèles, en particulier ChatGPT, représentent une ère pratique pour la compréhension du langage, le dialogue à plusieurs niveaux et la résolution de problèmes. Dans le même temps, les grands modèles résolvent efficacement le problème de la fragmentation des tâches de la PNL et améliorent considérablement l'efficacité de la R&D, marquant ainsi l'entrée de la PNL dans le secteur industriel. étape de mise en œuvre.
À l'heure actuelle, l'IA traverse l'ère 2.0, passant de modèles spécialisés pour une tâche unique aux modèles généraux pour un large éventail de tâches, puis à l'ère AGI de l'intelligence artificielle générale. L'ère de l'IA 2.0 innovera d'abord dans le contenu créatif, les méthodes bureautiques, les moteurs de recherche, les interfaces d'interaction homme-machine, la finance et d'autres domaines.
Fondée en juin 2021, Lanzhou Technology a lancé un certain nombre de produits et services externes à grand modèle. Elle a actuellement mis en œuvre une variété de technologies et de produits tels que le grand modèle Mencius, la plateforme AIGC (Intelligent Creation), la plateforme de traduction automatique et plateforme financière NLP, a atterri dans des sociétés telles que Flush et China Asset Management. En combinaison avec la technologie de type ChatGPT, Lanzhou Technology a lancé le robot de conversation MChat, qui peut aider les utilisateurs à effectuer diverses tâches dans des scénarios spécifiques grâce à un dialogue intelligent.
Parlant de l'orientation future de l'industrie, Zhou Ming a déclaré franchement que la technologie actuelle de type ChatGPT manque encore de raisonnement, de logique, de mathématiques et d'arithmétique, d'erreurs factuelles, etc. À l’avenir, neuf questions majeures liées aux grands modèles méritent particulièrement une attention particulière, impliquant des aspects tels que la capacité de raisonnement, l’exactitude des faits et les capacités de traitement chinoises.
2. Microsoft Xu Mingqiang : Coopérer avec OpenAI pour construire un superordinateur
Les paramètres du modèle affichent une tendance à la croissance exponentielle. Aujourd’hui, les doutes sur les grands modèles seront remplacés par de nouveaux doutes dans seulement 1 à 2 ans. Par conséquent, Xu Mingqiang, directeur de la technologie de l'unité commerciale omnicanal de Microsoft, est fermement convaincu que le modèle continuera de croître rapidement, car seul 1/10 du corpus actuel de haute qualité est actuellement utilisé.
▲Xu Mingqiang, directeur de la technologie de la division Microsoft Omni-Channel
Tout cela est indissociable du support d'une puissance de calcul puissante, qui détermine également la taille et les paramètres du modèle qui peut être entraîné. Par conséquent, Microsoft Azure a collaboré avec OpenAI pour créer un supercalculateur d'IA conçu pour la formation d'IA à grande échelle. L'ordinateur dispose de 285 000 processeurs et de 10 000 GPU.
Xu Mingqiang a comparé le grand modèle de langage à une éponge, Wikipédia, les articles médicaux ou scientifiques sont de l'eau, et brancher ces articles fera émerger ses capacités.
Enfin choisi les applications d'entreprise. À l'ère du processeur, le problème auquel les entreprises réfléchissaient lorsqu'elles postulaient était de savoir comment transformer les problèmes commerciaux en problèmes informatiques, c'est-à-dire convertir les applications en problèmes informatiques via des compilateurs. problèmes commerciaux en problèmes informatiques de tous horizons. Le problème se transforme en problème de traitement de contenu.
Les scénarios d'application ChatGPT au niveau de l'entreprise incluent le service client, le marché des ventes, la génération de contenu, la gestion des connaissances, la prise de décision assistée, etc.
3. Zhang Jiajun, Académie chinoise des sciences : Révélant le secret du « Purple East Taichu », le grand modèle multimodal a commencé à apparaître « multi-spécialisé et multifonctionnel »
Lors de la réunion, chercheur et directeur de doctorat de l'Institut d'automatisation de l'Académie chinoise des sciences et vice-président de l'Institut d'intelligence artificielle de Wuhan, Zhang Jiajun, a expliqué comment le grand modèle « Zidong Taichu » comprend les mystères techniques du monde.
▲Zhang Jiajun, chercheur et directeur de doctorat à l'Institut d'automatisation de l'Académie chinoise des sciences, et directeur adjoint de l'Institut d'intelligence artificielle de Wuhan
Zhang Jiajun a déclaré que l'effet de l'apprentissage profond des grands modèles pré-entraînés continue de s’améliorer. À l'heure actuelle, grâce à la méthode « big data + big model » dans des conditions d'apprentissage auto-supervisées, les grands modèles multimodaux commencent à apparaître « multi-spécialisés et multifonctionnels », faisant des progrès rapides dans l'apprentissage de petits échantillons, la question du langage naturel réponse, génération intermodale et autres aspects. Les grands modèles ont suscité une vague d'innovation, mais leur consommation d'énergie et leur coût sont extrêmement élevés, et leurs capacités cognitives sont encore loin derrière celles des humains.
« Zidong Taichu » est le premier grand modèle multimodal au monde avec 100 milliards de paramètres lancé par l'équipe de l'Institut d'automatisation de l'Académie chinoise des sciences. Zhang Jiajun a déclaré que ce modèle prend en charge l'apprentissage auto-supervisé multitâche au niveau des jetons, des modalités et des échantillons. Les données multimodales faiblement associées sont formées sur 512 cartes pendant 128 jours, tout en réalisant une modélisation unifiée de la compréhension modale et de la génération modale. . "Zidong Taichu" prend en charge des exemples de récupération et de génération multimodaux tels que la recherche d'images avec du texte, la génération de sons avec des images et la génération d'images avec des sons. Par exemple, si vous saisissez une image réelle, Zidong Taichu peut générer une image 3D personnalisée.
Actuellement, l'équipe a lancé la plateforme de services ouverts Zidong Taichu 1.0 et la plateforme de génération intelligente Zidong Taichu Luoshen 1.0 AIGC, et intégré des ressources de l'industrie, du monde universitaire et de la recherche pour construire un écosystème open source pour l'intelligence artificielle et explorer la voie vers industrialisation de l’intelligence artificielle générale.
4. Baidu Yuan Foyu : Les paroles de Wen Xin vont changer les règles du jeu sur le marché du cloud computing.
L'industrie mondiale de l'IA est entrée dans une période explosive, et l'IA est entrée dans une période explosive. créer un tout nouveau monde. En 2021, Robin Li, PDG de Baidu, a déclaré un jour : « Lorsqu'un ordinateur a la capacité de comprendre le langage naturel humain, a une capacité d'expression claire et une bonne capacité de raisonnement logique, il ressemblera beaucoup à un être humain. Et la mémoire et la puissance de calcul de la machine Bien mieux que les humains. Par conséquent, l’IA va certainement révolutionner tous les secteurs aujourd’hui. le support technique est la compréhension du langage naturel.
Yuan Foyu, vice-président du groupe Baidu, a souligné : « Parmi les principaux fabricants mondiaux, Baidu a été le premier à le publier. Microsoft a directement appelé Open AI, et Google a ouvert le test le 21 mars. Meta et Amazon n'ont pas vraiment publié le même type de produits maintenant. , produits du même niveau. "
Wen Xinyiyan possède cinq compétences de base, à savoir la création littéraire, la création de rédaction commerciale, le calcul logique mathématique, la compréhension du chinois et la génération multimodale. Il peut continuer à écrire. « Le problème des trois corps » et « Un rêve de demeures rouges » ; Générer une copie diffusée en direct ; signaler les erreurs dans les problèmes mathématiques et donner au processus de résolution une forte capacité de compréhension de la langue chinoise pour générer des images ; audio et vidéo basés sur le grand modèle de langage développé par Baidu. Yuan Foyu a déclaré qu'à en juger par la performance de Wenxin Yiyan, il a la capacité de comprendre les intentions humaines, et l'exactitude, la logique et la fluidité de ses réponses se rapprochent progressivement des niveaux humains. Une semaine après la conférence de presse de Wen Xinyiyan, plus de 100 000 entreprises ont postulé pour le test du service d'appel API de Wenxinyiyan.À l'ère de l'intelligence artificielle, la pile technologique informatique a une architecture à quatre couches : couche application, couche modèle, couche cadre et couche puce. Yuan Foyu a déclaré : « À l'échelle mondiale, Baidu est la seule entreprise à proposer des produits leaders dans ces quatre couches. » En outre, le développement de grands modèles apportera trois opportunités industrielles majeures dans le nouveau cloud computing, le réglage fin des modèles industriels et le développement d'applications.
3. La Chine produira-t-elle une OpenAI ? Investisseurs : je ne suis pas d’accord !
La pratique apporte de vraies connaissances. Lors de la réunion, Zhang Fuzheng, directeur du centre de traitement du langage naturel et du centre audio de Kuaishou MMU, a partagé l'exploration et l'application de Kuaishou dans l'AIGC en démontrant les derniers cas d'IA générant des personnes, de la musique et des vidéos numériques.
▲Zhang Fuzheng, responsable du centre de traitement du langage naturel et du centre audio de Kuaishou MMU
Zhang Fuzheng a d'abord parlé de sa compréhension de l'AIGC du point de vue du flux de travail, basée sur "le créateur introduit les idées qu'il souhaite exprimer et les synthétise grâce à la technologie d'IA Sortie de contenu « Point de départ du workflow, Kuaishou a présenté l'AIGC à travers des moteurs de plate-forme, une infrastructure, des capacités atomiques d'IA, des solutions AIGC, des scénarios d'atterrissage et d'autres aspects.
Dans le scénario humain numérique, en saisissant simplement du texte, les utilisateurs peuvent générer des applications humaines numériques avec des formes de bouche précises et des expressions/actions riches en 5 minutes. Elles peuvent être utilisées dans le commerce électronique, le recrutement, l'ancrage, la formation, etc. .
En termes de musique intelligente, les utilisateurs peuvent générer des paroles et des mélodies spécifiques qui riment et sont liées aux mots du sujet en fonction de la saisie par l'utilisateur des mots du sujet spécifiés et d'autres informations. Des applications telles que les chanteurs IA sont également proches du niveau de chant de. de vraies personnes.
En termes de production vidéo, la technologie AIGC est également très utile aux créateurs. Par exemple, la consommation moyenne du « film en un clic » de création vidéo de Kuaishou dépasse 450 millions, et la consommation quotidienne moyenne de films copiés dépasse 40 millions.
2. Wang Wei de Moxin Artificial Intelligence : L'informatique clairsemée devient la solution optimale pour la mise en œuvre de modèles à grande échelle, Moxin mène l'évolution de la puissance de calcul de l'IA 2.0Du côté de la demande, le développement de la civilisation numérique a connu une évolution fondamentale changements. L'IA générative ouvre la porte à la création d'applications à succès explosif, et la demande de puissance de calcul à l'ère des grands modèles d'IA 2.0 a été complètement renversée. Par rapport à l'ère des petits modèles de l'IA 1.0, axée sur la polyvalence de la puissance de calcul, les modèles de pré-formation à grande échelle ont des structures unifiées et se concentrent davantage sur l'évolutivité. La croissance de la puissance de calcul et de la vitesse d’inférence sont devenues des problèmes dans le développement et l’application de grands modèles.
Wang Wei, fondateur et PDG de MoXin Artificial Intelligence, a déclaré : « Il est difficile de répondre à la croissance exponentielle de la puissance de calcul en s'appuyant uniquement sur le matériel. le plus grand potentiel de développement et de mise en œuvre. « Par rapport à l'informatique dense, l'informatique clairsemée peut atteindre une amélioration des performances de 1 à 2 ordres de grandeur.
▲Wang Wei, fondateur et PDG de Moxin Artificial Intelligence
Au début de 2021, la première puce informatique d'IA à haut débit de Moxin, Antoum, a été enregistrée avec succès, puis Moxin a lancé une série de cartes informatiques d'IA. basés sur Antoum S4, S10 et S30 prennent en charge divers scénarios d'application d'IA. Basés sur l'algorithme double clairsemé unique et le concept de collaboration logiciel-matériel de Moxin, les produits de Moxin peuvent atteindre à la fois des performances élevées et une faible consommation d'énergie, et l'algorithme double clairsemé peut atteindre jusqu'à 32 fois la parcimonie dans de nombreux réseaux et applications.
Grâce à des mesures réelles sur le grand modèle open source BLOOM 176B, la carte informatique Ink Core S30 peut atteindre une vitesse de génération de 25 jetons/seconde en utilisant uniquement des taux de parcimonie moyens et faibles, et peut dépasser 8 A100 avec 4 S30 La vitesse de génération accélère considérablement la vitesse de raisonnement.
Wang Wei a déclaré : « Le développement rapide des grands modèles a donné aux startups de puces IA l'opportunité de défier des acteurs géants et dispose d'une nouvelle étape d'affichage, utilisant l'innovation disruptive pour apporter des percées de performances d'un ordre de grandeur
3. Qiming Venture Capital Zhou Zhifeng : Près de 60 % des entrepreneurs en IA générative se concentrent sur les applications multimodales, et l'écosystème chinois pourrait créer davantage d'opportunités
Au cours des 40 dernières années, avec la croissance explosive continue de la puissance de calcul et des données, la forme de la technologie de l'IA Les changements se produisent de manière exponentielle. Comment prédire les tendances et planifier à l’avance les nouveaux nœuds ? Zhou Zhifeng, partenaire de Qiming Venture Partners, a déclaré que cette vague d'IA pilotée par des modèles de pré-formation à très grande échelle a démontré des capacités de généralisation transformatrices et des phénomènes d'émergence de la technologie sous-jacente, et a dans une certaine mesure résolu les difficultés rencontrées par l'entrepreneuriat dans l'ère de l'IA 1.0. Il y a peu de problèmes, notamment le fait que la technologie de l'IA n'est qu'une petite partie cachée dans les produits finaux, la société manque d'attentes raisonnables en matière de technologie d'IA, le manque d'infrastructure et d'environnement complets de développement d'applications, le manque de sociétés cotées et systèmes de valorisation sur le marché des capitaux, etc. L’IA est redevenue un point chaud pour l’entrepreneuriat et l’investissement. Dans les deux ans suivant la publication du GPT-3 en 2020, les investissements dans les entreprises d’IA par les institutions mondiales de capital-risque ont quadruplé, avec 1,37 milliard de dollars de financement rien qu’en 2022. ▲ Zhou Zhifeng , partenaire de Qiming Venture Partners, est différent du fondateur de Baidu qui a déclaré que "la Chine n'aura fondamentalement jamais d'autre OpenAI". Zhou Zhifeng estime que la Chine et les États-Unis ont des environnements écologiques très différents pour une grande base d'IA. modèles , la Chine a de nombreuses opportunités uniques. En plus des orientations de modèles à grande échelle avec des barrières techniques élevées, une forte densité de talents et des exigences de capital élevées, les jeunes entrepreneurs, les vétérans de l'industrie verticale et les géants de l'industrie de l'IA ont tous des opportunités entrepreneuriales différentes dans de multiples dimensions de technologie et d'application. L'équipe technologique de Qiming Venture Capital a résumé une « carte » de la nouvelle vague d'architecture écologique de l'IA et des domaines de conception clés, de l'application de plates-formes informatiques intelligentes, de chaînes d'outils, de grands modèles open/fermés, de modèles auto-construits/tiers. -construction de modèles de fête, etc. Venez au capital-risque pour référence. Selon les statistiques de communication de l'équipe technologique de Qiming Venture Capital avec plus de 100 entreprises créées après 2020, dans le domaine de l'entrepreneuriat génératif en IA, 14 % des entrepreneurs se concentrent sur la technologie sous-jacente et 57 % se concentrent sur les applications multimodales, 29 % des Les entrepreneurs se concentrent sur les applications linguistiques. Les startups axées sur la technologie, capables de créer leurs propres barrières dans la technologie de l'IA, et les startups orientées vers les applications, capables de s'intégrer dans les flux de travail industriels et de fournir une valeur commerciale élevée, sont plus susceptibles de se démarquer. 4. Table ronde de dialogue : ChatGPT fera-t-il exploser la révolution technologique, « le gagnant remporte tout » ou « laisse fleurir cent fleurs » ? Comment le rugissant ChatGPT déclenche-t-il un nouveau cycle de révolution technologique ? Lors de la table ronde du matin, Zhang Guoren, co-fondateur et rédacteur en chef de Zhiyi Technology, a discuté avec Sun Bin, président et directeur de l'exploitation de Zhujian Intelligence, Huang Dongyan, scientifique en technologie vocale chez UBTECH, et Liang Yu, partenaire. de Creation Partners Capital, sur la technologie, l'industrie et l'investissement. Les questions explosives ont poussé l'atmosphère de la scène à son paroxysme. ▲Table ronde de dialogue, de gauche à droite : Zhang Guoren, co-fondateur et rédacteur en chef de Zhiyi Technology, Sun Bin, président et COO de Zhujian Intelligence, Huang Dongyan, scientifique en technologie vocale d'UBTECH , Liang Liang, partenaire de Creation Partners Capital YuChatGPT est né et a été salué par le PDG de NVIDIA, Jen-Hsun Huang, comme "le moment iPhone de l'intelligence artificielle", Sun Bin, président et COO de Zhujian Intelligence, qui se concentre sur la mise en œuvre. de l'industrie de la compréhension du langage naturel, a déclaré avec émotion que la popularité de ce produit est en effet due à leur De façon inattendue, le nouveau changement de paradigme provoqué par les grands modèles et les paramètres violents est devenu un début. UBTECH est un acteur majeur dans la mise à disposition de l'intelligence artificielle au service des robots. "L'émergence du GPT nous a permis de voir l'ère de l'intelligence artificielle pénétrer dans tous les domaines et les robots de service pénétrer dans des milliers de foyers", a déclaré Huang Dongyan, scientifique en technologie vocale chez UBTECH. ▲Huang Dongyan, un scientifique en technologie vocale d'UBTECHYann LeCun, l'un des trois géants du deep learning, a dit un jour que ChatGPT n'a pas d'innovation particulière, mais qu'il est juste bien combiné. Liang Yu, associé chez Creation Partners Capital qui se concentre sur l'investissement dans les entreprises technologiques en démarrage, a également exprimé un point de vue similaire. Il estime que d'un point de vue technique, l'intégration du système et l'ingénierie de l'architecture Transformer ont constamment innové, et ChatGPT. n’a pas réalisé de percée révolutionnaire. Huang Dongyan était d'accord avec le point de vue de Liang Yu et a ajouté qu'OpenAI avait découvert le « secret donné par Dieu » au cours du processus d'intégration et d'essais et d'erreurs, permettant au dialogue d'atteindre des performances époustouflantes semblables à celles d'un humain.
Par la suite, Zhang Guoren a soulevé une question qui a beaucoup retenu l'attention : le lancement du GPT-4 d'OpenAI et les versions successives de produits liés à Microsoft ont mis beaucoup de pression sur les pairs. Quelle est la durée du principal avantage de Microsoft + OpenAI. combinaison devrait-elle être maintenue ?
À cet égard, Sun Bin estime que toute combinaison d'outils de performance dépend de la manière dont les gens les utilisent et les appliquent. En fin de compte, la production des gens doit être utilisée comme critère. La valeur à long terme de leur combinaison réside dans la possibilité de les utiliser dans d’autres secteurs à l’avenir, afin que la technologie et l’industrie puissent être parfaitement unifiées. Huang Dongyan a déclaré que jusqu'où la combinaison de Microsoft et d'OpenAI peut aller dépend de ses capacités d'innovation technologique et de la vitesse de développement itératif. Bien entendu, un grand nombre d'entreprises d'IA pourraient émerger avec des technologies « cheval noir » dans le processus. .
▲Sun Bin, président et directeur de l'exploitation de Zhujian Intelligence
De manière générale, l'approche de Microsoft établit en fait un modèle pour le développement de cette industrie. Liang Yu a déclaré : « Dans une certaine mesure, Microsoft joue une stratégie écologique. » Les applications industrielles et l'accès des utilisateurs à l'écosystème peuvent former un « volant d'inertie des données », et sa vitesse de roulement deviendra de plus en plus rapide.
Dans l'environnement domestique, la formation sur grands modèles nécessite également un bon corpus d'apprentissage de la langue chinoise pour commencer à rouler comme un « volant d'inertie ».
Du co-fondateur de Meituan, Wang Huiwen, au fondateur de Sogou, Wang Xiaochuan, en passant par Kai-fu Lee annonçant le plan Project AI 2.0, de nombreux grands noms rejoignent la vague entrepreneuriale de l'AIGC. Lorsque Leslie Cheung a demandé si cette vague d'entrepreneuriat serait une tendance du type « le gagnant remporte tout » comme l'entrepreneuriat à l'ère d'Internet, ou une tendance « laisser fleurir cent fleurs », plusieurs invités ont été d'accord avec cette dernière.
Sun Bin a déclaré que la situation à l'ère des grands modèles est différente de l'ère des « grosses subventions » sur Internet. L'IA a formé un modèle relativement fixe de chaînes entrepreneuriales. Le nouveau grand modèle linguistique apporte de nouveaux moteurs sous-jacents. l'écologie industrielle et les modèles accumulés seront réutilisés et continueront à laisser fleurir une centaine de fleurs. Il a admis que les grands modèles linguistiques pourraient encore être dominés par les grands fabricants du secteur, mais que les avancées clés dépendront toujours des entreprises d'innovation scientifique et technologique.
Liang Yu est également d'accord avec ce point de vue. Il estime que même si les grands fabricants ouvrent la voie, les opportunités pour les start-ups pourraient résider dans la couche applicative, en coupant les domaines verticaux pour mettre en œuvre la mise en œuvre industrielle, réduire les coûts et accroître l'efficacité. "Les startups doivent apprendre à éviter les « traces de bêtes géantes ». Toutes les grandes entreprises émergent de petites lacunes. "
▲ Liang Yu
, associé chez Creation Partners Capital, a déclaré concernant les éléments que devrait avoir l'entrepreneuriat AIGC : Liang Yu a déclaré que la concurrence actuelle, l'environnement financier et les talents pour l'entrepreneuriat à grande échelle ont subi des changements qualitatifs par rapport aux deux années précédentes. La densité du capital, la densité des entrepreneurs et la densité des entrepreneurs ont besoin d'une forte augmentation. compétences techniques et compréhension de l’industrie.
Sun Bin estime que, tout comme le co-fondateur d'OpenAI a utilisé la technologie, les ressources et les connexions pour démarrer une entreprise il y a 8 ans, les entrepreneurs actuels doivent également prendre en compte trois éléments : la puissance de calcul, les ingénieurs et les données, afin que le démarrage d'une entreprise les entreprises peuvent obtenir le double du résultat avec la moitié de l'effort.
De nombreux intervenants lors du sommet ont souligné l'intelligence artificielle générale (AGI) comme la fin du développement de l'IA. Comment définir l'intelligence artificielle générale ? Quel est le problème ultime qu’il veut résoudre ?
Huang Dongyan estime que l'intelligence artificielle générale et l'intelligence artificielle dans les domaines verticaux sont en fait complémentaires l'une de l'autre. Intuitivement, les grands fabricants fourniront une plate-forme pour l'intelligence artificielle générale, tandis que l'intelligence artificielle dans les domaines verticaux doit mener un développement en profondeur. différentes industries.
Sun Bin a déclaré qu'en regardant le présent dans dix ans, cela pourrait être le point de départ de l'intelligence artificielle générale. Liang Yu a également mentionné que cette année pourrait être la première année de l'intelligence artificielle générale. À partir d'aujourd'hui, l'intelligence artificielle générale pourrait lentement pénétrer dans tous les aspects de la production et de la vie des gens, comme l'eau et l'électricité.
Zhang Guoren a déclaré que peut-être de nombreux films de science-fiction ont déjà décrit pour nous l'apparition de l'intelligence artificielle générale, comme Jarvis dans Iron Man et MOSS dans The Wandering Earth. Bien que les formes soient différentes, ils atteindront le niveau de l'intelligence. Ou plus qu’humain.
▲Zhang Guoren, co-fondateur et rédacteur en chef de Zhiyi Technology
Donc, si nous regardons 10 ans plus tard sur la vague actuelle d'innovation des applications AIGC, quelle sera sa signification et son impact sur le industrie technologique et société humaine ?
Sun Bin estime que si nous regardons aujourd'hui et 10 ans plus tard, cela constituera un changement majeur dans la façon dont les ordinateurs interagissent, rendant les gens n'auront plus besoin d'apprendre des langues complexes. Liang Yucheng a également mentionné que cette année pourrait être la première année de l'intelligence artificielle générale. À partir d'aujourd'hui, l'intelligence artificielle générale pourrait progressivement pénétrer dans tous les aspects de la production et de la vie des gens, comme l'eau et l'électricité.
D'un point de vue éthique, Huang Dongyan a déclaré : « Comment stimuler les effets positifs de la technologie basée sur la nature humaine est très critique. Dans dix ans, peut-être que chacun aura son propre robot intelligent, afin que les gens puissent être mieux équipés. après avoir amélioré l'efficacité. "Profiter de la vie en toute sécurité". Parallèlement, les questions de sécurité et d'éthique sont devenues des préoccupations pour les industriels. Huang Dongyan estime qu'une gouvernance globale est nécessaire à partir des lois et réglementations, de l'autodiscipline de l'entreprise, de la sensibilisation du public, des normes d'éthique de sécurité, etc.
Zhang Guoren a conclu que dans dix ans, il devrait y avoir beaucoup de choses auxquelles nous sommes habitués maintenant, qui deviendront alors inhabituelles. D'un point de vue actuel, c'est comme la façon dont les gens sont maintenant habitués à utiliser les paiements électroniques. ou l'adoption anticipée de méthodes de paiement en espèces.
Lors du forum des grands modèles de l'après-midi, Zhang Peng, PDG de Beijing Zhipu Huazhang Technology Co., Ltd., a expliqué le grand modèle pré-entraîné, fondement de l'ère de l'IA générative, fondateur de Luchen Technology, Singapour. You Yang, jeune professeur et président du Département d'informatique de l'Université nationale, a discuté des défis et des pratiques de formation à faible coût de grands modèles d'IA.
Shi Jianping, partenaire d'investissement de Lanchi Ventures, estime que les grands modèles de langage pré-entraînés inaugurent l'ère de l'intelligence cognitive Xu Tianhao, responsable de l'architecte de solutions pour l'industrie Internet grand public de NVIDIA, et Yang Fan, co-fondateur de SenseTime &. président du groupe d'entreprises de grands appareils, calcule Il apporte un aperçu des aspects pratiques de la puissance et des algorithmes.
1. Zhipu AI Zhang Peng : Les grands modèles ont également la loi de Moore, explorant de nouvelles voies pour le GLM
Le premier intervenant du forum des grands modèles est Zhang Peng, PDG de Beijing Zhipu Huazhang Technology Co., Ltd. comme : Zhipu AI). En tant que pionnier dans l’industrie et le monde universitaire, il a partagé le parcours technique et les progrès de mise en œuvre des grands modèles de pré-formation.
▲Zhang Peng, PDG de Beijing Zhipu Huazhang Technology Co., Ltd.
Les grands modèles pré-entraînés sont devenus l'infrastructure d'une nouvelle génération d'applications d'IA. Zhang Peng a déclaré qu'il existe une loi de Moore dans le domaine des grands modèles : le nombre de paramètres dans un seul modèle augmentera de 10 fois chaque année. Lorsque les paramètres du modèle atteignent des centaines de milliards, le grand modèle a dépassé un seuil important de changement qualitatif et ChatGPT en est un représentant.
"Nous avons travaillé dur." Zhang Peng a déclaré que, sur la base de la transformation des résultats du Département d'informatique de l'Université Tsinghua, Zhipu AI a lancé son premier grand modèle multimodal en 2021. Zhang Peng a déclaré que la formation d'un modèle de 100 milliards est confrontée à divers défis et nécessite de la patience et du temps.
Zhang Peng a déclaré que le rapport d'évaluation du modèle bilingue GLM-130B développé conjointement par Zhipu AI montre que le GLM-130B est proche ou égal au GPT-3 175B (davinci) en termes d'indicateurs de précision et d'équité. De plus, depuis l'année dernière, Zhipu AI a successivement open source l'outil de code d'IA CodeGeeX et publié le modèle open source ChatGLM-6B qui peut être exécuté sur une seule carte. En même temps, il a lancé des applications d'écriture auxiliaires gratuites. tels que "Writing Frog" et le produit de dialogue personnalisé "Xiaodai", qui abaissent considérablement le seuil d'utilisation de grands modèles.
Enfin, Zhang Peng a souligné le concept de modèle en tant que service (MaaS) lors de la réunion, préconisant de fournir des méthodes de déploiement flexibles, depuis les grands modèles pré-entraînés jusqu'aux API en passant par les applications multi-niveaux, et du cloud à la privatisation en passant par le tout-en-un. déploiement.
2. Luchen Technology Youyang : Construire une grande infrastructure de formation de modèles Colossal-AI pour réduire le coût de mise en œuvre de grandes applications de modèles d'IA
Le nombre de paramètres de modèle d'IA a augmenté des dizaines de milliers de fois en quelques années seulement. À l’avenir, l’IA pourrait être plus intelligente et plus puissante que le cerveau humain. Le défi auquel est confronté aujourd’hui la formation des grands modèles est le coût extrêmement élevé de la formation.
Alors que le big data et les grands modèles s'améliorent simultanément, comment créer des méthodes d'optimisation plus efficaces, réduire les coûts et augmenter l'efficacité, parvenir à un calcul évolutif et efficace et réduire les coûts de mise en œuvre des applications des grands modèles d'IA est devenu un problème clé dans le industrie.
Luchen Technology a construit un ensemble d'infrastructures efficaces de formation de grands modèles d'IA distribuées Colossal-AI. Il contient trois parties : un système de gestion de mémoire efficace, une technologie parallèle à N dimensions et une méthode d'optimisation à grande échelle.
Selon le jeune professeur You Yang, fondateur de Luchen Technology et président du département d'informatique de l'Université nationale de Singapour, Colossal-AI est devenu l'un des logiciels à la croissance la plus rapide sur le marché mondial des logiciels de base et est open source. sur Github : https:// github.com/hpcaitech/ColossalAI
▲You Yang, fondateur de Luchen Technology et président du Département d'informatique de l'Université nationale de Singapour, jeune professeur You Yang
The N La technologie parallèle dimensionnelle développée par Luchen Technology crée un tenseur parallèle de dimension supérieure. Une variété de stratégies parallèles en son sein fournissent une solution de formation distribuée moins coûteuse et efficace pour les grands modèles.
De plus, sur la base du système de planification hétérogène de Colossal-AI, les utilisateurs n'ont besoin que d'écrire une ligne de code pour gérer dynamiquement la mémoire GPU, la mémoire CPU et le disque dur, augmentant ainsi la capacité de modèle du matériel des dizaines de fois.
Par exemple, la précédente formation GPT-3 avec 175 milliards de paramètres nécessitait 128 GPU, tandis que Colossal-AI ne nécessite que 64 GPU, réduisant considérablement les exigences matérielles et les coûts des grands modèles. Avec le même équipement, Colossal-AI peut aider les utilisateurs à terminer la formation des modèles plus rapidement et à réduire les coûts.
3. Shi Jianping de Lanchi Ventures : L'intelligence cognitive est devenue l'avant-garde de l'IA, et les « applications AI-First » sont devenues une tendance
Shi Jianping, partenaire d'investissement de Lanchi Ventures, a proposé ce grand langage pré-entraîné. les modèles ouvrent la cognition À l'ère de l'intelligence, l'intelligence cognitive est devenue la prochaine frontière de l'IA.
▲Shi Jianping, partenaire d'investissement de Lanchi Ventures
Les machines acquièrent des capacités cognitives sans précédent telles que la génération et la compréhension du langage, le raisonnement des connaissances, etc. Derrière elles se trouvent AI OS (système d'exploitation), des modèles de base et une pré-formation modèles et améliorations La technologie d’apprentissage et d’autres aspects sont prêts.
Comment les startups peuvent-elles s'ouvrir au monde de l'intelligence cognitive ? Shi Jianping a suggéré que toutes les entreprises n'ont pas besoin de créer de grands modèles. Elles peuvent également partir du chemin d'application vertical, par exemple en utilisant leurs propres données pour affiner les modèles open source/modèles hébergés par des tiers ; chemin, comme la fourniture aux développeurs d'applications verticales en aval Fournir des outils de plate-forme tels que la formation, le réglage fin, la gestion et les services.
Il a déclaré : « Les grands modèles de langage pré-entraînés ont ouvert une ère d'informatique intelligente avec l'intelligence cognitive comme principale force motrice. » Le fondement de la civilisation numérique est le code, et l'intelligence cognitive redéfinira également la façon dont les logiciels sont construits. L'IA "-First application" deviendra une tendance. Par exemple, la nouvelle version du moteur de recherche de Microsoft, Bing, a déjà donné d'excellents exemples.
"Le rythme actuel des itérations technologiques est plus rapide que ce que PPT a plaisanté." Dans ce contexte, comment les entreprises peuvent-elles établir des avantages concurrentiels essentiels ? Selon lui, l'essentiel sera l'utilisation de données personnelles pour former et affiner les modèles d'intelligence artificielle. Dans le même temps, l'intégration du monde intelligent et du monde numérique apportera plus d'imagination.
4. NVIDIA Xu Tianhao : La collaboration logicielle et matérielle permet une efficacité de puissance de calcul supérieure à 50 % lors de la formation de GPT3 sur des clusters à grande échelle
L'amélioration de la puissance de calcul matérielle repose non seulement sur l'amélioration de la technologie des puces, mais également sur la capture précise des besoins et des tendances de l'évolution des algorithmes de modèles d'IA, a déclaré Xu Tianhao, responsable de l'architecte de solutions pour l'industrie Internet grand public de NVIDIA : « Trouvez le. points clés de l'accélération informatique et continuer à innover. Pour répondre aux futurs besoins des entreprises. pour effectuer la formation d'un modèle, et davantage de composants individuels sont nécessaires pour pouvoir interagir les uns avec les autres.
NVIDIA introduit les technologies NVLink, NVSwitch et IB. Les architectures Ampere et Hopper construisent des nœuds basés sur NVSwitch et effectuent une mise en réseau de cluster via le réseau IB, afin que ces individus puissants puissent collaborer efficacement pour réaliser la même chose.
Le matériel sous-jacent est la base Pour que les développeurs puissent utiliser le matériel et réellement résoudre le problème, une collaboration logicielle est nécessaire. Par conséquent, NVIDIA a créé des SDK et des applications de scène dans le passé pour résoudre des problèmes dans divers secteurs. Parmi eux, NeMo Framework est conçu pour résoudre les problèmes de formation de modèles à grande échelle et de déploiement d'inférence. Alors, comment évaluer le nombre de ressources nécessaires pour entraîner GPT-3 ? Xu Tianhao a expliqué une formule : temps consommé = FLOPS requis pour créer un modèle plus grand/puissance de calcul effective du matériel. Basé sur l'intégration efficace de méthodes parallèles et une série d'optimisations, le NeMo Framework de NVIDIA peut faire en sorte que les performances effectives de la puissance de calcul matérielle atteignent plus de 50 % pendant la formation de GPT-3. De plus, afin d'accélérer le déploiement à grande échelle de grands modèles par les entreprises, NVIDIA NeMo Framework propose également une solution intégrée de grands modèles basée sur l'intégration de FasterTransformer et Triton.5. Yang Fan de SenseTime : Le paradigme de production de l'IA a subi des changements majeurs, et l'intelligence artificielle inaugurera une « ère de la découverte » plus prospère
Lors de la réunion, le co-fondateur de SenseTime et président de la Yang Fan, groupe d'entreprises de grands appareils, a expliqué la voie du changement et le cercle de compétences des startups issues de « l'ère des petits modèles ».▲Yang Fan, co-fondateur de SenseTime et président du groupe d'entreprises de grands appareils
L'IA est à la tête d'une nouvelle génération de révolution technologique, de la recherche scientifique assistée par l'IA et de l'IA générative au robot conversationnel récemment populaire ChatGPT . Une grande puissance (de calcul) produit des miracles et les changements quantitatifs conduisent à des changements qualitatifs. Yang Fan a déclaré que le paradigme de production de l'IA subit un changement majeur : l'ère des grands modèles arrive.
Yang Fan a déclaré qu'à l'ère des « petits modèles » de l'IA au cours des 10 dernières années, les méthodes d'apprentissage en profondeur et les outils de production industrialisés de petits modèles pour résoudre des problèmes uniques ont progressivement mûri dans la nouvelle ère des grands modèles, le grand modèle en tant que modèle ; Le service (MaaS) est devenu le nouveau thème. Le thème a donné naissance à un nouveau paradigme d'IA centré sur la réduction des coûts des grandes infrastructures de modèles, la course à l'armement en matière de puissance de calcul et de données, ainsi que les commentaires des utilisateurs en temps réel.
Face à cette tendance, SenseTime, ancré dans l'IA depuis près de 10 ans, a développé le grand appareil SenseCore, qui permet le développement de modèles extrêmement volumineux à partir de quatre niveaux : infrastructure native d'IA, plate-forme de production de grands modèles, services de modèles d'algorithmes et expérience dans l'industrie. Yang Fan a déclaré que SenseTime combinerait des années d'expérience accumulée dans l'industrie pour fournir des produits et services d'infrastructure d'IA de nouvelle génération à haute efficacité, à faible coût et à grande échelle, et accélérerait la production et le déploiement de centaines de milliards de grands modèles à travers le monde. empiler et promouvoir la collecte de données, l'annotation, l'efficacité de la gestion a été grandement améliorée et le cycle d'itération du modèle a été raccourci. Dans le même temps, SenseTime fournira également des services d'assistance au développement de grands modèles pour garantir la mise en œuvre des résultats de développement. 6. Session spéciale de type ChatGPT : La bataille entre To B et To C, grand modèle VS petit modèle Dans l'après-midi, forum spécial de type ChatGPT en Chine, Li Xiaohan, co-fondateur et vice-président de Yunzhisheng, et fondateur et le PDG de Zhujian Intelligence Jian Renxian et le PDG de Kunlun Wanwei Fang Han ont respectivement expliqué le processus de développement et les perspectives de l'industrie de leurs grands modèles de langage.1. Yunzhisheng Li Xiaohan : L'évolution de l'IA présente trois lois majeures, et les entreprises évolueront vers deux voies : générale et verticale
Li Xiaohan, co-fondateur et vice-président de Yunzhisheng, a déclaré que l'émergence de ChatGPT se fera. avoir une grande influence pour les startups d'IA a déclaré que le sentiment le plus important est que l'AGI pourrait devenir une réalité dans les prochaines années, et ils essaient de trouver des moyens de s'intégrer dans la vague des grands modèles.▲Li Xiaohan, co-fondateur et vice-président de Yunzhisheng
L'évolution de l'IA montre trois lois, de centrée sur l'algorithme à centrée sur le modèle, du petit et beau aux grands projets et au déclin des tâches intermédiaires. Les tâches intermédiaires font référence à des tâches intermédiaires qui n’avaient pas d’objectifs indépendants dans le développement précédent de l’IA et qui seront progressivement affaiblies ou disparaîtront.
Avant 2022, les géants et les startups de l'IA construisent de grands modèles, et l'émergence de ChatGPT a vérifié la faisabilité de cette voie pour l'industrie. "Lorsque les paramètres du modèle atteignent une certaine échelle, des capacités" émergentes "peuvent apparaître", a déclaré Li Xiaohan, et au niveau de l'intelligence cognitive, après une certaine période de développement, les machines peuvent surpasser les humains.
Dans le même temps, les grands modèles ont ouvert deux voies pour le développement des entreprises, à savoir la création de services généraux de grands modèles et de grands modèles pour les scénarios verticaux. La plate-forme générale de grands modèles des grands fabricants fournira des services externes et produira des volants d'inertie miniatures au « prix du chou ». Les entreprises confrontées à différents scénarios ont besoin de modèles plus verticaux à grande échelle et accordent davantage d’attention à la contrôlabilité des données et des services.
Yunzhisheng se concentrera sur l'industrie médicale intelligente, lancera de grands modèles pour des industries spécifiques et fournira aux clients de grands modèles personnalisés par les entreprises, basés sur l'industrie. Li Xiaohan a déclaré que leur vision était de passer de la version industrielle à la version universelle améliorée.
2. Jian Renxian de Zhujian Intelligence : "Large Language Model + Knowledge + Application", le futur système d'exploitation de l'intelligence artificielle générale
Jian Renxian, fondateur et PDG de Zhujian Intelligence, a déclaré que les grands modèles de langage deviendront le base de l'intelligence artificielle générale Le système d'exploitation apportera « deux mondes », l'un est le monde fermé dirigé par OpenAI et Microsoft, et l'autre est le monde open source dirigé par Deepmind et Google. Il estime que la combinaison des startups et des grandes entreprises permettra à l'innovation de prendre de l'ampleur et de créer une situation où « cent fleurs s'épanouissent ».
▲Jian Renxian, fondateur et PDG de Zhujian Intelligence
Il a en outre souligné que le futur paradigme logiciel sera constitué d'applications pilotées par la technologie du langage naturel, composées d'un « grand modèle de langage + connaissances + application ». Il estime que le modèle en lui-même n'a aucune valeur réelle, mais que les applications segmentées basées sur de grands modèles de langage ont une valeur réelle. C'est pourquoi il dirige le développement du « Modèle en tant qu'application » (MaaA) plutôt que du « Modèle en tant que service » (MaaS). ).
Jian Renxian estime que les applications basées sur ChatGPT apporteront une valeur énorme aux cols blancs et apporteront de la valeur aux entreprises, telles que l'automatisation du service client, les assistants virtuels, la gestion des connaissances et la formation des employés. Quatre scénarios d'application seront d'abord renversés.
Afin d'équilibrer les avantages et les inconvénients des grands modèles de langage et des petits modèles de langage, Jian Renxian a proposé une formule : « Petit modèle de traitement du langage naturel + modèle de connaissances + grand modèle = moteurs doubles de traitement du langage naturel ». peut rendre les grands modèles plus puissants, plus contrôlables, utilisables et explicables. Actuellement, Zhujian Intelligence a tiré parti de son expertise en traitement du langage naturel pour intégrer des produits évolutifs existants avec des modèles de langage à grande échelle afin de fournir des modèles pré-entraînés pour diverses industries.
3. Kunlun Wanwei Fanghan : Il existe trois lacunes majeures dans le développement des grands modèles entre la Chine et les pays étrangers. L'innovation des modèles commerciaux nationaux commence par les services aux entreprises
De grands modèles avec des centaines de milliards de modèles commencent à émerger. Véritable intelligence artificielle générale, le moment iPhone de l’IA est déjà arrivé. Fang Han, PDG de Kunlun Wanwei, a déclaré que ChatGPT pourrait devenir une étape importante dans l'évolution de la vie basée sur le carbone vers la vie basée sur le silicium, et ce serait la deuxième évolution dans l'histoire de l'humanité.
▲Fang Han, PDG de Kunlun Wanwei
Cependant, l'écart actuel dans le développement des grands modèles entre la Chine et les pays étrangers comprend trois aspects. Premièrement, le coût annuel de 50 à 100 millions de dollars américains est le ticket pour former des centaines de milliards de grands modèles. la qualité des textes chinois n'est pas élevée. Le plus grand écart est l'écart technologique en matière d'ingénierie.
Fang Han a déclaré que les efforts d'OpenAI en direction du GPT prouvent que l'intelligence artificielle générale est réalisable. Après la sortie et l'expérience de GPT-3, il pensait que GPT-3 représentait une étape importante pour l'AIGC et bouleverserait considérablement le domaine de la génération de contenu.
Au niveau des applications, Fang Han a déclaré que l'industrie de l'AIGC suivrait la logique de réduction des coûts pour le côté B et d'augmentation de l'efficacité pour le côté C. On peut voir que la configuration de Microsoft sur la face B est axée sur les grands clients dans des secteurs tels que la finance et l'énergie. La raison en est que « les données de ces entreprises peuvent être combinées avec de grands modèles tels que GPT pour générer la production de nouvelle génération ». paradigme." Du côté C, en prenant comme exemple le Copilot de Microsoft, cela améliorera la productivité des gens.
Par conséquent, Fang Han prédit que l'innovation des modèles commerciaux dans l'industrie nationale de l'AIGC apparaîtra d'abord dans le domaine des services d'entreprise côté B, suivi par le domaine des outils UGC côté C.
Dans l'après-midi, forum spécial sur l'innovation des applications AIGC, Hao Yiyang, directeur technique d'aiXcoder, directeur du groupe Filmpu et président de Pékin, Fan Shuo, Computational Aesthetics. (Nolibox), Huang Shengyu, co-fondateur, a discuté de la collision et de l'intégration de l'AIGC avec la génération de code, le métaverse, la conception et la créativité et d'autres industries.
1. aiXcoder Hao Yiyang : GPT-4 apporte de nouveaux changements dans la génération de code et favorisera l'expansion des modèles à des centaines de milliards à l'avenir
Lors de la réunion, le CTO d'aiXcoder (Silicon Heart Technology) Hao Yiyang a amené un sujet intitulé "Modèle de langage à grande échelle" Discours d'ouverture sur "La génération de code à l'ère (LLM)".
Il a déclaré que GPT-4 a apporté de nouveaux changements dans la génération de code, prenant en charge des séquences plus longues, un réglage plus fin des numéros d'instructions, des opérations multimodales (saisie d'image) et autres, montrant des effets plus adaptés à un usage général, et dans le même temps, il est également confronté à de nombreux problèmes, notamment le manque de fichiers pertinents, de bibliothèques dépendantes et de documents d'exigences, la lenteur, les menaces pour la sécurité des informations, etc.
En fait, il existe une grande différence entre les modèles de génération procédurale et les modèles de langage. Par exemple, en termes de méthodes d'interaction, les modèles de langage de dialogue ordinaires se concentrent principalement sur les questions, réponses et continuation, tandis que les modèles de génération procédurale doivent combler les vides. , complétez et sauvegardez. Il y a encore beaucoup de choses que GPT-4 ne peut pas faire dans la génération de code. Par exemple, en termes de performances en temps réel, GPT-4 n'est pas applicable dans certains scénarios de correction et de complétion de code qui nécessitent des séquences contextuelles en temps réel ; encore limité. Il est difficile de prendre en compte tout le contexte des projets de moyenne et grande taille ; il existe un grand écart entre les informations complètes des projets de code et le texte du crawling web.
En tant que startup entrée sur la piste des robots de programmation intelligents IA en 2018, aiXcoder a lancé le premier produit de modèle de pré-formation de génération de code du pays, aiXcoder XL, en juin 2022. Le produit prend en charge la sortie d'une entrée en langage naturel complète vers des langages de programmation à part entière.
En ce qui concerne la feuille de route d'aiXcoder, Hao Yiyang a déclaré qu'aiXcoder favoriserait l'expansion des modèles de dizaines de milliards à des centaines de milliards, ajouterait une grande quantité de données mixtes de traitement du langage naturel + code et construirait spécifiquement des ensembles de données d'instructions pour divers scénarios de programmation, obtenant ainsi un outil d'édition de code avec de meilleures performances globales.
▲aiXcoder (Silicon Heart Technology) CTO Hao Yiyang
2 Fan Shuo de Movie Group : La construction d'un système d'exploitation numérique pour les terminaux de contenu et la multimodalité inaugureront une explosion dans les deux prochaines années
.IA générative Elle a atteint un stade explosif et l'explosion des applications qu'elle apporte fait ressentir aux gens le processus de l'IA passant de la perception à l'intelligence cognitive, et ouvre un vaste espace de marché.
ChatGPT a amené la modalité texte à une période d'explosion, mais la période d'explosion des images, des vidéos et des sons n'est pas encore arrivée à cette époque. Fan Shuo, directeur du Movie Book Group et président du district de Pékin, a déclaré qu'avec l'émergence des demandes de l'industrie et l'amélioration de l'efficacité de la production, les images, les vidéos et même les jumeaux numériques deviendront une tendance irréversible à l'avenir, les rendant plus intuitifs et pratique pour les gens d'obtenir des informations.
▲Fan Shuo, directeur du Film Group et président du district de Pékin
L'ensemble de la transformation technologique est identique au processus de développement humain, de la résolution de tâches répétitives à la réflexion sur la logique et la créativité.
Actuellement, les modalités textuelles ont apporté des améliorations à la productivité des gens. Fan Shuo a déclaré : « 2023 à 2025 sera une ère d'explosion multimodale. » mais une production auto-interactive définie par l'utilisateur.
De plus, pour les entreprises terminales, « les modèles ne sont pas directement accessibles à de nombreuses entreprises », a déclaré Fan Shuo. Par conséquent, le modèle nécessite plus d'applications à connecter et plus de plates-formes à prendre en charge, puis les données peuvent être structurées et uniquement lors de la production. le contenu est standardisé et rationalisé peut-il être véritablement appliqué à l'ensemble du processus de génération de contenu. Movie Group a développé un système d'exploitation numérique IA.
Le développement de la grande industrie du modélisme continuera de s'adapter à certains travaux répétitifs dans le domaine de la génération de contenu. À l'avenir, son système atteindra des capacités de standardisation, tout en s'arrimant aux moteurs ouverts correspondants pour construire un écosystème global et continuera de le faire. rayonnent différents modèles tels que l’état du texte, du son, des images et des vidéos.
3. Esthétique informatique Huang Shengyu : Saisissez les « trois éléments » de la transformation et laissez l'AIGC stimuler la créativité du design
L'IA affecte l'art humain. Huang Shengyu, co-fondateur de Computational Aesthetics (Nolibox), a expliqué comment l'AIGC stimule l'innovation dans les mécanismes de conception et de production créative.
▲ Huang Shengyu, co-fondateur de Computational Aesthetics (Nolibox), a déclaré que l'intégration et l'évolution de la conception et de l'informatique sont passées par trois étapes : l'ère 1.0 est la conception assistée par machine représentée par Adobe, et l'ère 2.0 L'ère est la conception assistée par machine représentée par Adobe. Outils de conception numérique représentés par Canva et d'autres outils, l'ère 3.0 est basée sur la conception directe d'AIGC. À cette fin, l'esthétique informatique a lancé des outils tels que "Picture Universe" et "Paint Universe". ".
"La conception intelligente est à l'industrie du design ce que la conduite autonome est à l'industrie des transports." Huang Shengyu a déclaré : "Mais le comportement de conception est complexe et n'a généralement pas de solution optimale. La fonction d'optimisation n'est souvent pas unique et claire."
Réaliser une conception contrôlable et une production créative pilotée par l'AIGC se heurte à au moins trois défis majeurs : 1. L'incommensurabilité linguistique des humains et des machines en matière de créativité. 2. Obtenir et analyser les exigences créatives de conception complexes. 3. Les solutions créatives générées par la conception sont difficiles à itérer et à mettre en œuvre. À cet égard, Huang Shengyu a proposé « trois éléments » pour la transformation de la cognition de conception en cognition robotique : 1. La nature quantifiable des actifs de conception. 2. La généralisabilité de l'expérience de conception. 3. Simulation du comportement de conception.
Computational Aesthetics, fondée en 2020, est une entreprise technologique incubée par l'Université Tsinghua. Elle a lancé le premier ensemble de données de conception visuelle disponible dans le commerce au monde. Ses produits principaux incluent l'outil de productivité AIGC « Hua Universe » et le moteur de conception intelligent « Hua ». Universe", la prochaine étape consiste à lancer la plateforme créative de conception d'IA Yeahpix.
Conclusion : L'IA générative fait exploser l'innovation dans le paradigme de production de contenu et d'interaction, témoignant de l'arrivée d'une nouvelle ère de l'IA
Lors de cet événement AIGC, nous avons vu que ChatGPT est né du développement et de l'accumulation de technologies à l'ère des grands modèles, qui ont enthousiasmé l'industrie, le monde universitaire et la communauté des investisseurs. Dans le même temps, ce produit phénoménal est devenu une étape importante dans l'ère des grands modèles, démontrant le potentiel d'émergence de l'intelligence pour les entreprises profondément impliquées dans les grands modèles depuis de nombreuses années.
Dans le même temps, l'échelle des paramètres du modèle a explosé et la difficulté de former des centaines de milliards de modèles peut être imaginée. Au niveau des puces d'IA et de la puissance de calcul, il existe des opportunités de déploiement à grande échelle de génératifs. Produits d'IA.
L'IA générative a apporté une innovation d'application perturbatrice, du texte, des images, des codes, des vidéos et même de la production créative, à l'industrie du métaverse, l'IA générative a ouvert un espace illimité pour la création et l'imagination dans différentes industries. De plus en plus de produits de type ChatGPT sont commercialisés et l’IA pénètre dans tous les domaines, accélérant l’ère de l’intelligence artificielle générale.
En regardant vers l'avenir, l'IA générative nous mène dans un nouveau monde d'IA, et l'évolution rapide de ChatGPT déclenche une nouvelle révolution technologique.
Le Sommet de l'innovation GTIC 2023 China AIGC deviendra une plate-forme importante permettant aux milieux industriels, universitaires et de recherche de mener des échanges approfondis et de stimuler les idées autour des technologies de pointe et la mise en œuvre industrielle des entreprises AIGC dans diverses subdivisions est invitée à devenir témoin de l'événement. arrivée de la nouvelle ère de l’IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!