Maison > Article > Périphériques technologiques > Comment Microsoft a-t-il intégré GPT-4 si rapidement ? L'équipe du projet a même fait des heures supplémentaires le week-end
News le 6 avril, Microsoft a intégré GPT-4 d'OpenAI dans la suite d'applications de productivité Microsoft 365. C'est une tâche très difficile, mais l'entreprise a toujours espéré la terminer le plus rapidement possible. Par conséquent, Microsoft a mobilisé des centaines d'employés, leur a demandé de faire des heures supplémentaires pendant de longues périodes, de réfléchir ensemble à des solutions de produits et de développer trois modes de travail d'assistants d'intelligence artificielle basés sur un cadre de conception unifié.
C'est un mot qui a été mentionné d'innombrables fois dans les salles de conférence et les couloirs de Microsoft au cours des derniers mois. Il fait référence au 16 mars, jour où Microsoft a annoncé qu'il introduirait un modèle d'IA générative co-développé avec OpenAI dans la suite d'applications de productivité Microsoft 365. En intégrant GPT-4, chaque application de productivité dont Outlook, Word et Teams disposera d'un Copilot (copilote intelligent) basé sur l'intelligence artificielle générative. Actuellement, plus de 20 clients Microsoft testent cette technologie.
L'intégration d'un assistant IA dans autant d'applications est une tâche ardue, mais Microsoft souhaite y parvenir rapidement. En novembre de l'année dernière, la sortie de ChatGPT par OpenAI a fait sensation dans le monde entier et a déclenché une course à l'intelligence artificielle. Les entreprises se lancent dans une course contre la montre pour lancer de nouveaux produits et fonctions d'intelligence artificielle afin de saisir les opportunités du marché. Même Microsoft, qui a déjà coopéré et investi dans OpenAI, ne fait pas exception
Le directeur de la conception de Microsoft, Jon Friedman, est responsable de la conception des produits Copilot dans Microsoft 365. Il a déclaré que ce projet nécessite de longues heures de travail de la part de centaines d'employés de Microsoft, notamment des concepteurs, des ingénieurs, des chefs de produit, des spécialistes du marketing, des data scientists, des équipes d'éthique, etc. L'ensemble du projet durera plusieurs mois et nécessitera même des heures supplémentaires le week-end. Friedman a déclaré que le plan exigeait également que les gens se retiennent et travaillent ensemble pour construire un projet d'une telle envergure en si peu de temps, donnant à chacun le sentiment qu'il devait mettre de côté son ego et travailler ensemble.
Friedman a déclaré : « C’est excitant que nous puissions faire des choses vraiment audacieuses et importantes ensemble. Même si nous avons beaucoup d’expérience en matière d’intelligence artificielle, cette IA générative particulière est encore plus puissante, donc je pense que tout le monde travaille avec une mentalité d’apprentissage. .”
Friedman estime que Copilot est une nouvelle forme d'« expérience utilisateur conversationnelle » qui peut faire appel à des ressources plus riches. Il a déclaré que Copilot est un assistant de bureau qui représente « une nouvelle frontière dans la conception d'interfaces utilisateur, changeant le paradigme établi, tout comme la première génération d'appareils à écran tactile ». Il est rapporté que Copilot est développé sur la base du modèle de langage à grande échelle GPT-4, pré-entraîné sur une grande quantité de contenu Internet, et peut accéder aux données commerciales dans Microsoft Graph, générant ainsi automatiquement du contenu tel que des e-mails et des points de rencontre.
Le défi dans la conception d'une interface utilisateur comme Copilot est de savoir comment et quand présenter ce nouvel assistant d'intelligence artificielle alors que les gens travaillent habituellement dans des applications telles que Word et Powerpoint.
Friedman a déclaré qu'au départ, concevoir ce type d'assistant d'intelligence artificielle pouvant être appelé via diverses applications de productivité n'était qu'"une vague idée". Mais à mesure que l’équipe de conception a acquis une compréhension plus approfondie de l’application des assistants d’intelligence artificielle dans les affaires réelles, cette idée a commencé à devenir plus claire. Tout d’abord, l’équipe de conception doit trouver des cas d’utilisation spécifiques dans lesquels l’IA peut faire gagner du temps aux utilisateurs ou stimuler la créativité d’une manière ou d’une autre. Il s’agit de la première étape du processus de conception de l’expérience utilisateur.
Les personnes qui connaissent le mieux les cas d'utilisation pertinents sont les ingénieurs, les chefs de produit, les concepteurs et les informaticiens de chaque application de productivité. L'équipe de conception de Friedman a travaillé en collaboration avec eux. Lorsque le projet Copilot a démarré, il a demandé à toutes les équipes produit de réfléchir à des moyens d'exploiter l'IA générative pour améliorer les capacités des applications de productivité. Friedman a ensuite créé une équipe de conception horizontale spéciale pour travailler avec toutes les équipes d'application afin de démontrer les effets de Copilot dans chaque application.
Friedman a déclaré qu'à mesure que les équipes d'application individuelles commençaient à développer des cas d'utilisation, les équipes de conception horizontales ont commencé à remarquer des points communs entre ces cas d'utilisation, à savoir des cas d'utilisation de l'IA pertinents pour plusieurs applications.
Friedman a rappelé le processus de brainstorming de l'époque et a déclaré : « Nos discussions ont été très utiles... Nous avons discuté des exigences fonctionnelles spécifiques de Copilot, telles que la manière dont le nouveau modèle de langage génératif peut nous aider à mieux remplir la mission de rédaction du résumé des e-mails ?
À mesure que les cas d'utilisation inter-applications devenaient plus clairs, les équipes de conception horizontales ont commencé à croire que la fonctionnalité de l'assistant IA n'avait pas besoin d'être unique pour chaque application.
Friedman a déclaré : "Parce qu'il y a beaucoup de gens... qui essaient de regarder chaque scène et d'être capables de porter un jugement approximatif, comme : 'Ah, cette chose est également apparue.'"
Alors ils ont commencé à concevoir. d'un Concevoir un cadre qui permet à un assistant universel de fonctionner de plusieurs manières prévisibles différentes à travers les applications.
L'équipe de conception dirigée par Friedman a créé une bibliothèque de documentation approfondie conçue pour aider les concepteurs du projet à créer des points d'entrée pour l'IA dans une application donnée. Ils guident les concepteurs dans la détermination de la manière d'invoquer Copilot en fonction des différentes tâches dans lesquelles un utilisateur peut être impliqué. Friedman a déclaré : « Il existe un concept selon lequel Copilot doit apparaître au bon niveau et effectuer le bon travail. » Le cadre de conception stipule que Copilot peut être affiché de trois manières dans l'interface utilisateur de l'application.
La première est une expérience utilisateur immersive qui permet à l'assistant IA de se concentrer sur des projets commerciaux spécifiques plutôt que sur une application spécifique, de sorte que des données ou des points clés puissent réellement être extraits de plusieurs applications pour servir le travail à accomplir. Par exemple, Copilot peut collecter les jalons du projet ou les points de risque à partir des réunions d'équipe, des diapositives ou du contenu des e-mails, puis les résumer et les résumer dans un document de plan de projet.
Le mode d'expérience « Immersive » est la fonctionnalité la plus puissante de Copilot dans la suite d'applications de productivité, et il est peut-être aussi la plus influente. Rob Enderle, analyste principal du cabinet de conseil en marché Enderle Group, estime que cela pourrait également aider à résoudre un problème de longue date avec la suite de productivité de Microsoft : les applications individuelles ne sont pas étroitement intégrées les unes aux autres. Endler a déclaré que la raison pourrait être que Microsoft avait initialement acquis ces applications auprès d'autres sociétés et ne partageait pas les bases de code entre elles. Mais Copilot peut couvrir toutes les applications, donnant au moins aux utilisateurs le sentiment que ces applications peuvent fonctionner ensemble pour certaines tâches.
Friedman a déclaré que le deuxième mode d'affichage est "assisté", ce qui signifie que Copilot est comme un "side-car" pour une moto à trois roues side-car, aidant les utilisateurs à maximiser l'appel d'application dans une fonction spécifique. Par exemple, dans PowerPoint, Copilot peut montrer aux utilisateurs comment les capacités graphiques approfondies de l'application peuvent être utilisées pour décrire des ensembles de données complexes ; dans Outlook, Copilot peut aider les utilisateurs à comprendre le contenu le plus important d'un e-mail dans Word, Copilot peut fournir des informations sur les commentaires ; sur la façon de mieux rédiger des documents et de s'adapter à des styles d'écriture spécifiques.
De plus, dans la présentation « embarquée » de Copilot, l’intelligence artificielle peut exercer des capacités génératives et créatives dans les applications. Par exemple, Copilot peut apparaître dans une fenêtre contextuelle pour un document Word. "C'est comme une expérience aléatoire", a déclaré Friedman. "Lorsque vous êtes immergé dans le travail, Copilot peut vous aider à résoudre votre blocage d'écriture ou vous aider automatiquement à démarrer un diaporama avec du contenu textuel." a commencé à utiliser un concept à « trois niveaux » pour décrire le travail, et les membres des différentes équipes d'application ont progressivement adopté ce cadre.
Il a déclaré : "Nous avons partagé ce cadre avec le PDG Nadella et d'autres membres de l'équipe de direction de l'entreprise, et il a été pratiquement reconnu par tout le monde. Cette idée peut être appliquée à trois niveaux de travail différents."
Le nom Copilot était non créé spécifiquement pour Microsoft 365. GitHub, propriété de Microsoft, a utilisé ce nom pour appeler son assistant de programmation en 2021, et certaines de ses fonctions utilisaient également le modèle de langage à grande échelle d'OpenAI. Microsoft crée un assistant Copilot cohérent capable d'exécuter certaines fonctions standardisées dans différentes suites d'applications de productivité. Pour les utilisateurs de longue date d’applications de productivité, ces nouveaux travaux réduiront probablement le sentiment d’inconnu qu’ils ressentiront lors du lancement officiel de la nouvelle version de Microsoft 365. En utilisant un assistant unifié, les utilisateurs peuvent utiliser différentes applications plus facilement, améliorant ainsi l'efficacité du travail.
À mesure que l’intelligence artificielle générative est davantage intégrée dans les produits grand public et d’entreprise de Microsoft, la marque et le concept Copilot pourraient être étendus aux systèmes d’exploitation Windows et même à d’autres produits Microsoft tels que LinkedIn.
"Nadella a vraiment aimé le nom car il décrivait parfaitement ce que fait l'assistant IA", a déclaré Friedman. "Il existe pour vous aider et vous guider dans de nombreuses tâches..."
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!