Maison >Périphériques technologiques >IA >Le programmeur d'IA le plus puissant au monde : avec la bénédiction de GPT-4o, il ne faut que 84 secondes pour répondre à la demande.

Le programmeur d'IA le plus puissant au monde : avec la bénédiction de GPT-4o, il ne faut que 84 secondes pour répondre à la demande.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBoriginal: 2024-08-14 13:38:32604parcourir

Semua orang dalam senarai menunggu.

Model besar sedang pesat membangun di jalan "menggantikan pengaturcara manusia".

Pada Mac tahun ini, jurutera perisian kecerdasan buatan Devin meletupkan komuniti AI Produk ini dikuasakan oleh model bahasa besar (LLM) asas OpenAI-4 dan boleh menulis dan mengedit secara bebas selepas menerima arahan teks bahasa semula jadi. kod.

Tetapi dalam bidang AI generatif, pembangunan pesat adalah tema utama, dan kini teknologi itu berulang lagi.

Minggu ini, syarikat permulaan yang disokong Y Combinator yang dipanggil Cosine mengumumkan pelancaran jurutera AI autonomi baharunya, Genie. Syarikat itu berkata Genie mudah mengatasi Devin, menjaringkan 30% pada penanda aras pihak ketiga SWE-Bench, manakala Devin hanya memperoleh 13.8%.

Alat baharu ini malah mengatasi Q Amazon dan Kod Droid Kilang sebanyak 19% dan kini merupakan pengaturcara AI berprestasi terbaik di dunia. Prestasi W Genie pada penanda aras SWE-Bench, dan perbandingan dengan model kod AI yang lain.

Le programmeur dIA le plus puissant au monde : avec la bénédiction de GPT-4o, il ne faut que 84 secondes pour répondre à la demande.

^{"Model ini lebih daripada penanda aras: ia dilatih dari bawah dengan matlamat untuk berfikir dan bertindak seperti manusia SWE (Jurutera Perisian)," Pengasas Bersama dan Ketua Pegawai Eksekutif Cosine Alistair Pullen berkata.}

Jin yang boleh membetulkan pepijat dan menulis kod

Sebagai model kejuruteraan perisian AI lanjutan, Genie boleh mengendalikan pelbagai tugas pengekodan mengikut arahan jurutera manusia, termasuk pembetulan pepijat dan fungsi binaan pemfaktoran semula kod, ujian kod, dsb.

Genie boleh berjalan sepenuhnya secara autonomi atau bekerjasama dengan pengguna untuk menyelesaikan tugasan.

Ia menyokong berbilang bahasa pengaturcaraan, seperti yang ditunjukkan dalam laporan teknikal, termasuk JavaScript, Python, TypeScript, TSX, Java, C#, C++, C, Rust, Scala, Kotlin, Swift, Golang, PHP, Ruby.

Cosine mendakwa bahawa Jin boleh mensimulasikan proses kognitif jurutera manusia. "Biarkan ia memerhati bagaimana jurutera manusia bekerja dan meniru proses itu."

Isu keselamatan sentiasa menjadi kebimbangan semua orang Kod yang dijana oleh Genie disimpan dalam repositori GitHub pengguna, jadi Cosine tidak akan menyimpan salinan kod, sekali gus mengelakkan risiko keselamatan yang datang bersamanya.

Selain itu, platform perisian Cosine telah menyepadukan Slack dan pemberitahuan sistem, yang seperti rakan sekerja AI, mengingatkan pengguna tentang status atau isu pembenderaan.

Alistair Pullen menunjukkan cara menggunakan Genie untuk menyelesaikan masalah sebenar. Sasaran ialah isu pada GitHub Kami hanya perlu melepaskan pautan terus ke dalamnya, dan AI akan menganalisis masalah secara automatik dan mula memikirkan fail yang diperlukan untuk menyelesaikan masalah sehingga keperluan dipenuhi.

Kemudian, Genie akan mula cuba memecahkan masalah kepada banyak langkah penyelesaian, dan kemudian menjana kod. .

Le programmeur dIA le plus puissant au monde : avec la bénédiction de GPT-4o, il ne faut que 84 secondes pour répondre à la demande. Keputusan output akhir: dua fail, 17 ujian, hanya 84 saat.

Je ne sais pas combien de fois plus rapide que les programmeurs humains.

Le contexte long est alimenté par des modèles OpenAI

Contrairement à de nombreux modèles d'IA qui s'appuient sur des modèles de base complétés par une poignée d'outils, Genie est développé via un processus propriétaire.

En ce qui concerne les modèles, Genie est construit sur une variante (actuellement) non universelle de GPT-4o, qu'OpenAI permet à Cosine de former dans le cadre du programme d'accès expérimental.

Le rapport technique nous a appris que lorsque les chercheurs ont commencé à créer Genie, ils n'ont pu affiner qu'un modèle de fenêtre contextuelle relativement courte, comprise entre 16 et 32 000.

Afin de résoudre ce problème, l'équipe a mené de nombreuses premières explorations de ces modèles et les a formés sur un vaste ensemble de données de plus de 100 millions de jetons. Bien qu'il ait été constaté que l'architecture présente certains avantages, elle. est toujours confronté à une limite sur la quantité d’informations qu’un modèle peut traiter dans un laps de temps donné.

Après avoir essayé diverses méthodes de compression/chunking, l'équipe a décidé que la seule solution était d'utiliser un modèle contextuel plus large, même si aucun modèle n'était disponible à l'époque.

Heureusement, peu de temps après, des modèles OpenAI assurant l'entraînement du contexte long sont apparus.

Cosine a déclaré dans son article de blog qu'ils avaient passé près d'un an à organiser l'ensemble de données. Lors de la formation la plus récente, Genie a été formé sur des milliards de données symboliques, et les données sélectionnées incluaient le langage de programmation que les utilisateurs utilisent actuellement. qui préoccupe le plus. Voici la proportion de données dans différents langages de programmation en cours de formation de Genie :

Ce qui suit est la proportion de données pour différentes fonctions telles que la réparation et la reconstruction de bogues :

En termes de prix, selon Pullen, Genie Pricing sera initialement divisé en deux niveaux :

Option d'entrée de gamme au prix d'environ 20 $. Ce niveau aura certaines fonctions et restrictions d'utilisation, adaptées aux individus et aux petites équipes ;
Les options de niveau entreprise offrent des fonctions étendues et une utilisation presque illimitée, tout comme avoir un collègue IA maîtrisant le codage. Mais les prix à ce niveau seront plus élevés.

Le lancement de Genie a de profondes implications pour les équipes de développement de logiciels, en particulier celles qui cherchent à augmenter la productivité et à réduire le temps consacré aux tâches quotidiennes. Grâce à sa capacité à gérer de manière autonome des défis de programmation complexes, Genie peut changer la façon dont les ressources d'ingénierie sont allouées, permettant ainsi aux équipes de se concentrer sur des initiatives plus stratégiques.

Pullen a déclaré que le fait de ne plus avoir de ressources en ingénierie comme une limitation était un énorme facteur de motivation pour lui, surtout depuis le lancement de l'entreprise. Il estime que la valeur d'un collègue IA capable d'accéder rapidement à des bases de code inconnues et de résoudre des problèmes invisibles est évidente et a un impact énorme sur le monde.

À l'avenir, la société a l'intention d'élargir sa gamme de modèles pour inclure des modèles plus petits pour des tâches simples et des modèles plus grands capables de relever des défis plus complexes. De plus, Cosine prévoit d'étendre son travail à la communauté open source.

Genie est désormais disponible pour certains utilisateurs, mais un accès plus large n'est pas encore entièrement disponible.

Adresse de candidature : https://cosine.sh/register

Équipe fondatrice : seulement cinq personnes

Startup Genie proposée Cosine par Pullen, Sam Stenner et Yang Li en Fondée en 2022, sa mission est de repousser les limites de l’IA en appliquant le raisonnement humain pour résoudre des problèmes complexes. De toute évidence, leurs efforts commencent par le génie logiciel.

Parmi eux, Yang Li est un Chinois diplômé d'un master de l'Université d'Oxford et qui a été sélectionné sur la liste européenne Forbes 30 Under 30 en 2021.

Cosine a levé 2,5 millions de dollars en financement de démarrage auprès d'Uphonest et SOMA Capital, avec la participation également de Lakestar, Focal et d'autres.

L'équipe est peut-être petite, mais Cosine a déjà fait des progrès significatifs dans le domaine de l'IA, et Genie n'est qu'un début.

"Nous croyons fermement que nous pouvons développer des capacités de raisonnement au niveau humain pour n'importe quel travail et n'importe quel secteur", a déclaré Pullen dans l'article d'annonce."L'ingénierie logicielle n'est que le point de départ le plus intuitif, nous révélerons bientôt tout le reste sur lequel nous travaillons." -considérations-to-help-organizations-implement-an-ai-code-of-conducts/

https://cosine.sh/blog/genie-technical-report

^{https : //cosine.sh/blog/state-of-the-art}

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Python Java php JavaScript ruby swift scala typescript kotlin golang rust 架构 Token register li github 人工智能 https 软件工程重构 bug issue gpt scala

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：L'utilisation quotidienne moyenne du modèle Tokens of Doubao dépasse 500 milliards et la famille de modèles est à nouveau mise à niveauArticle suivant：L'utilisation quotidienne moyenne du modèle Tokens of Doubao dépasse 500 milliards et la famille de modèles est à nouveau mise à niveau

Articles Liés

Voir plus