Maison >Périphériques technologiques >IA >A Zhihu, j'ai vu les premières lueurs de la transformation de ChatGPT

A Zhihu, j'ai vu les premières lueurs de la transformation de ChatGPT

王林avant: 2023-04-07 23:51:021447parcourir

S'il y a un changement, Zhihu aura une réponse.

En recherchant "ChatGPT", il semble que vous soyez instantanément déplacé vers la ligne de front où vous pouvez entendre le klaxon :

Le président de Sinovation Ventures, Kai-Fu Lee, a résumé les règles générales pour sauver sa carrière dans le ère post-ChatGPT

Andrew Ng, fondateur de DeepLearning.AI Avertissez les gens, placez les questions éthiques et juridiques avant le fanatisme

Yuan Jinhui, fondateur de la technologie de première classe, estime qu'il s'agit d'une question urgente qui doit être abordée. La question à étudier est de savoir comment distinguer le texte généré par les humains du texte généré par ChatGPT ?

Hu Yongze, auteur de "Digital Survival" et de l'École de journalisme et de communication de l'Université de Pékin, a proposé lors de la table ronde "Zhichao 8h30" diffusée en direct que l'orientation du développement de l'intelligence artificielle ne doit pas nécessairement être "humaine". -like", mais devrait être pour améliorer les gens. Capacité ;

...

Grâce à des questions-réponses, des sujets, des tables rondes, des idées et des émissions en direct brûlantes, les leaders de l'industrie sont apparus les uns après les autres dans le haut- La communauté de questions et réponses de qualité de l'Internet chinois ; les investisseurs, les chercheurs scientifiques, les entrepreneurs et les praticiens se connectent les uns aux autres pour explorer toutes les frontières de ChatGPT et réfléchir aux implications futures de leurs découvertes.

En seulement quatre mois, la popularité du sujet « ChatGPT » sur Zhihu a battu le record établi par le sujet « AlphaGo » depuis 2015, avec un total de 220 000 discussions et un total de 380 millions de vues.

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Le sujet est extrêmement populaire et la méthode de présentation est également complète et multidimensionnelle.

1. Le pouvoir de la première annonce

Le 2 janvier 2023, un étudiant en informatique de l'Université de Princeton a publié GPTZero. Ce programme peut "rapidement et efficacement" déchiffrer si l'auteur d'un article est un humain ou ChatGPT. .

Après avoir vu la nouvelle, le répondeur de Zhihu "Kaizhu" a eu l'impression d'être attaqué. Le 10ème jour après le lancement de ChatGPT, "Grasspod" Guo Biyang, doctorant de troisième année au AI Lab de l'École de gestion et d'ingénierie de l'information de l'Université de finance et d'économie de Shanghai, a déjà commencé ce travail avec ses amis. "Nous avons en fait été les premiers à créer l'équipe du détecteur ChatGPT", a-t-il déclaré.

Plus de 30 000 personnes ont essayé GPTZero dans la semaine suivant sa sortie, et l'application a planté pendant un certain temps. Guo Biyang est devenu nerveux. Le plan initial était qu'en plus du détecteur, l'équipe de huit personnes effectuerait également une évaluation manuelle et une analyse statistique linguistique. Évidemment, nous ne pouvons plus attendre maintenant.

Après avoir formé plusieurs détecteurs à l'aide d'ensembles de données existants, le 11 janvier, ils ont publié une démo sur Zhihu, qui est le premier détecteur ChatGPT en Chine. La Fête du Printemps approchait et Guo Biyang, qui était censé discuter avec sa famille et se remémorer le bon vieux temps, regardait l'écran sans prêter attention à personne. "Ma famille pense que nous sommes peut-être en train de faire quelque chose de grand."

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Nous sommes dans une industrie où les itérations technologiques sont de plus en plus rapides. Le plus terrifiant n'est pas que la technologie soit divulguée, mais ce n'est pas suffisant. les gens le comprennent. Votre technologie est liée à vous, sans parler de la percée révolutionnaire de ChatGPT ?

"Les gens du cercle de l'IA veulent promouvoir leur travail, et beaucoup de gens choisissent d'aller à Zhihu. Le travail est transmis par tout le monde et il est plus facile pour davantage de gens de le voir en profondeur." Sujet d'apprentissage Xie Lingxi, un excellent répondant qui est « conscient de son âge » depuis dix ans, a déclaré.

Lorsque Guo Biyang et ses partenaires faisaient une course contre la montre pour lancer la démo, une série de travaux liés à ChatGPT est également apparue sur Zhihu.

PENG Bo, un excellent répondeur sur des sujets liés à l'intelligence artificielle, L'auteur de ChatRWKV, un projet open source qui évalue publiquement ChatGPT, a appelé Zhihu à ce que davantage de personnes participent à la co-construction de l'écosystème.

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Fin février, ChatExcel, le premier ouvrage utilisant le langage naturel pour commander le travail Excel, a été lancé en exclusivité sur Zhihu.

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Cependant, les commentaires de la communauté qui ont suivi ont surpris Guo Biyang.

Avant la sortie, ils ont comparé les deux détecteurs. Parce qu'ils ont été formés sur l'ensemble de données, l'effet réel de leur détecteur était bien meilleur que celui de GPTZero. Yuan Jinhui, fondateur de First-Class Technology, a également expliqué comment distinguer le texte généré par les humains du texte généré par ChatGPT sur Zhihu : « C'est un problème urgent.

Au départ, de nombreuses opinions circulaient selon lesquelles cela fonctionnait. » n'avait aucun sens.

"Ce sur quoi nous nous concentrons, c'est la détection des fausses nouvelles, pas des fausses nouvelles générées par ChatGPT. Si un classificateur ne peut gérer que les fausses nouvelles générées par ChatGPT, alors ce ne sera pas fini si je change de générateur ?"

Certaines personnes pensent également que "nous pouvons éviter d'être détectés comme ChatGPT grâce au polissage".

Guo Biyang a décidé de répondre personnellement. "On peut dire que nos détecteurs ne sont pas efficaces, mais si nous disons que les détecteurs n'ont aucun sens, alors j'ai une opinion. Il y a des failles dans la loi, et les personnes sans foi ni loi peuvent profiter des failles de la loi. Est-ce que cela signifie que la loi n'a aucun sens ?"

Lorsque les gens peaufinent et modifient le contenu de ChatGPT afin d'éviter d'être détectés, le rôle du détecteur a été atteint. Il existe dix mille façons de contourner diverses réglementations, et tout ce que nous pouvons faire, c'est augmenter le « coût de l'irresponsabilité ».

Au fil du temps, les voix de soutien et d'encouragement se font de plus en plus nombreuses.

"La valeur du détecteur varie d'une personne à l'autre, mais je pense personnellement que cet ensemble de données est plus précieux et peut faire des choses intéressantes."

Hu Naying, chercheur au département de technologie de contenu du Cloud Institute de l'Académie chinoise des technologies de l'information et des communications, a déclaré lors de la diffusion en direct de la table ronde de Zhihu "Zhicha 8h30" que la technologie anti-triche n'est actuellement pas aussi puissant que la technologie ChatGPT, et "le chat et la souris" apparaîtront inévitablement un phénomène de "jeu", "mais après tout, le diable est toujours meilleur que le diable

En fait, décider de publier votre travail sur Zhihu." équivaut à choisir d'entrer dans un système complexe. La soi-disant complexité signifie qu'elle n'est pas linéaire et ne fonctionnera pas selon vos attentes. Elle comporte de nombreuses dimensions et variables et est difficile à prévoir. Par conséquent, il y aura des « prises au dépourvu », mais il y aura aussi des avantages et des avantages. même des surprises inattendues.

Maintenant, le détecteur de l'équipe Guo Biyang compte 6 700 étoiles sur Github. L’ensemble de données et le modèle ont peut-être été téléchargés des dizaines de milliers de fois, et l’article a été cité 20 fois en moins de deux mois. "Ce sont des choses auxquelles nous n'avions jamais pensé auparavant", a-t-il déclaré avec une certaine émotion : "(Le taux de croissance des citations de l'article) est plus rapide que n'importe lequel de mes articles précédents."

Peu de temps après la première publication exclusive de Zhihu, WPS a contacté ChatExcel. L’équipe derrière. Le projet open source ChatRWKV a également été évoqué par les principaux médias technologiques.

En plus d'être imprévisible, la complexité du système Zhihu inclut également une sorte d'adaptabilité. La publication d'un ouvrage changera le système, et le système calibrera à son tour votre produit ou votre recherche.

En novembre 2022, après que l'équipe de Xie Lingxi a publié un article important sur le site Web de préimpression arXiv, il a également été immédiatement publié sur Zhihu. Le titre montrait un grand modèle météorologique : « Pour la première fois, la précision du moyen et du long terme. Les prévisions météorologiques à terme ont dépassé les valeurs traditionnelles. "

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

"Le titre m'a fait lire rapidement l'article original." Après l'avoir lu, un internaute a exprimé son appréciation pour les réalisations de l'article. Après une discussion avec les membres de l'équipe dans l'espace commentaire, elle a partagé son avis :

"L'entrée du modèle IA vient d'ERA5 (un champ d'analyse assimilé à partir d'observations et de modèles), il utilise donc également des prévisions de modèles, et le modèle n'a pas cette prévision ERA5 (c'est-à-dire l'entrée de l'IA), donc le modèle doit toujours être exécuté, et il n'y a pas de prévision de modèle alternatif indépendant Actuellement, c'est le cas (assimilation de modèle traditionnel + prévision d'IA). ) > (assimilation de modèle traditionnel + prévision de modèle traditionnel)."

Le grand modèle d'IA est formé sur les données ERA5. Les données ERA5 sont des données de réanalyse, qui sont un ensemble complet de données de réanalyse obtenues principalement par le contrôle de la qualité et le traitement d'assimilation de données d'observation provenant de diverses sources (sol, navires, radiosondages, ballons éoliens, avions, satellites, etc.). Analyser des ensembles de données.

Le processus d'assimilation consiste ici à transformer certaines données d'observation en données météorologiques maillées standard. Il ne faut pas prétendre transcender les méthodes traditionnelles de prévision numérique du temps (PNT) sans aborder ces techniques.

"Oui, cela devrait prendre beaucoup de temps. Le premier problème est que les données semblent difficiles à obtenir (il y a donc très peu de travail connexe au pays et à l'étranger)." Les membres de l'équipe l'ont également reconnu.

En fait, "L'IA ne peut pas encore le faire, ou en d'autres termes, l'IA n'a pas encore été officiellement capable de le faire. La raison principale est qu'il n'y a pas de données, nous l'a expliqué plus tard Xie Lingxi." . Pour ce faire, l'extrémité d'entrée de l'IA doit obtenir des données telles que les satellites et les stations météorologiques. Quel que soit le pays dans lequel elle se trouve, ces données sont hautement confidentielles.

"Grâce à l'annonce des données d'assimilation par le Centre météorologique européen depuis des décennies, nous avons terminé ce travail

Bientôt, Xie Lingxi a mis à jour la réponse, "Nous acceptons cet avis." Dans l'article sur le modèle météorologique à grande échelle de Pangu, nous avons limité la prévision numérique du temps aux « méthodes de prévision basées sur des données assimilées », plutôt que de faire référence à l'ensemble du « domaine de la prévision météorologique numérique ». Pangu a pour la première fois surpassé les méthodes traditionnelles d'assimilation des données : nous utilisé. L'environnement de test est exactement le même que celui de NVIDIA FourCastNet, garantissant l'équité de la comparaison et la crédibilité des conclusions. un rapport de l'Administration météorologique chinoise. Ils ont également été contactés par le Centre météorologique européen. On dit qu’il y a beaucoup de discussions au sein du Centre météorologique européen sur le fait que de nombreuses technologies existantes seront remplacées par l’IA.

Certaines entreprises ont également contacté Guo Biyang pour explorer la possibilité de lancer des fonctions associées sur la plateforme de texte. 「Notre algorithme continue de s'améliorer, principalement en augmentant la robustesse du modèle et en collectant des données plus diverses, en espérant que le modèle de prochaine génération sera plus efficace.」

Après avoir accepté les commentaires des internautes de Zhihu, voici ce que Guo Biyang fera faire la prochaine cible.

2. Rencontre avec la « Baleine 52 Hertz »

Les chercheurs se précipitent pour lancer leurs travaux, et le capital « tue » également intensément les grands talents de l'IA. Le 27 mars à 23 heures, un message est passé discrètement sur WeChat : Wang Huiwen et Yuan Jinhui ont fondé First-Class Technology et ont atteint une intention de fusion pour créer une version chinoise d'OpenAI.

Dans le domaine du Large Language Model (LLM), un cadre autrefois considéré comme le moins important par beaucoup, sa valeur a augmenté au point que les stratèges militaires doivent rivaliser pour l'obtenir. "Maintenant, il semble qu'il s'agisse d'un modèle national qui se concentre véritablement sur la technologie sous-jacente." Un expert en algorithme Tencent AI qui a suivi les sujets liés à Zhihu a soupiré.

Il y a six ans, Yuan Jinhui a quitté Microsoft Research Asia pour démarrer une entreprise créant un cadre d'apprentissage profond. La situation à cette époque n'était pas différente de celle de la fameuse « baleine 52 Hertz ».

Intégrer des applications algorithmiques et le matériel sous-jacent, le cadre d'apprentissage en profondeur est appelé « système d'exploitation d'intelligence artificielle » et constitue un gâteau que les startups ne peuvent même pas imaginer. À cette époque, avec son énorme influence et ses fortes capacités de promotion, le framework d'apprentissage profond TensorFlow de Google était déjà le framework d'apprentissage profond comptant le plus d'utilisateurs à l'époque (Pytorch en était encore à ses balbutiements).

Google est une si grande entreprise, avec des centaines de personnes qui font la même chose, comment pouvez-vous rivaliser avec les autres ? Utiliser des logiciels de bas niveau, avoir des concurrents aussi puissants et être open source... Ce que Yuan Jinhui entendait le plus à l'époque était « battre un œuf contre un rocher » et « essayer d'utiliser le bras d'une mante comme un chariot ».

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Parce que la fréquence de 52 Hz est beaucoup plus élevée que celle de toute espèce de baleine connue, les scientifiques pensent que le cri d'une baleine détecté par les instruments militaires américains ne peut pas être reçu par d'autres baleines.

Le cycle de développement des logiciels système est très long. Il a fallu quatre ans entre son lancement en 2016 et juillet 2020 avant que le cadre d'apprentissage profond OneFlow soit open source. Parce qu'ils ne pouvaient pas supporter la pression d'une grande incertitude et l'impossibilité de tout retour d'information avant la publication du logiciel système fini, certains collègues exceptionnels ont démissionné.

En fait, une fois que la technologie aura atteint un niveau aussi profond dans le système, il y aura naturellement moins de « baleines » pouvant entrer en résonance avec elle. À Zhihu, Yuan Jinhui trouve encore des gens qui se soucient autant que lui des questions fondamentales.

De nombreux internautes de Zhihu connaissent "Teacher Mu" (le nom Weibo de Yuan Jinhui) à l'époque Weibo. "Jinhui écrivait des nouvelles très intéressantes sur Weibo, et tout le monde répandait des rumeurs sur l'identité de ce type", se souvient Yang Jun, directeur technique de l'architecture informatique IA de Nvidia. Peu de temps après que Yuan Jinhui a démarré son entreprise, Yang Jun envisageait également de changer d'emploi, et les deux se sont rencontrés via Zhihu.

Dans l'esprit de Yuan Jinhui, Yang Jun, un excellent répondeur sur des sujets d'apprentissage automatique et d'apprentissage profond et le nouveau répondeur de connaissances 2022, a produit régulièrement du contenu de haute qualité tout au long de l'année, et il a également appris de lui. J'ai beaucoup bénéficié de ma réflexion.

Aux yeux de Yang Jun, Yuan Jinhui est aussi un ami relativement facile à parler. Yang Jun lui-même a également analysé de manière comparative les deux principaux cadres d'apprentissage profond et pourquoi, à ce stade, certaines entreprises sont encore prêtes à investir d'énormes ressources dans le développement de cadres d'IA.

Lorsque Google a publié MLIR en 2019, le sujet des compilateurs d'apprentissage profond a alors attiré beaucoup d'attention. Les deux hommes sont rapidement apparus sous la question « Que pensez-vous de l'attention portée par Google au projet MLIR ? » et ont partagé leurs points de vue l'un après l'autre.

Yuan Jinhui n'avait pas une haute opinion de MLIR à l'époque et estimait que le concept de compilateur-compilateur était un peu redondant. MLIR fournit uniquement un échafaudage pour l'écriture de compilateurs d'apprentissage profond et ne résout aucun problème spécifique dans les compilateurs d'apprentissage profond.

Yang Jun est plus enclin à penser que le MLIR est une bonne chose. "Son analyse de la contribution, de la valeur et des lacunes du MLIR m'a impressionné jusqu'à ce jour", a déclaré Yuan Jinhui.

Au fur et à mesure que la réflexion et la discussion s'approfondissaient, Yang Jun a continué à mettre à jour la réponse initiale avec de nouvelles idées et de nouveaux gains. Yuan Jinhui maintient également sa flexibilité cognitive. En 2022, Yuan Jinhui a de nouveau mis à jour sa réponse originale : « Le développement des deux dernières années montre que le MLIR fournit un « échafaudage »... C'est très significatif.

Les gens ont besoin d'un environnement, et les gens avec. des goûts similaires peuvent communiquer et entrer en collision. Les attributs de Zhihu peuvent y parvenir. Yang Jun a essayé d'expliquer ce merveilleux destin. Par exemple, en suivant vos questions, intérêts et articles, vous pouvez naturellement juger si vous pouvez parler davantage.

Après que OneFlow soit devenu open source, certains internautes "ont eu un éclaircissement soudain et ont découvert que certains des problèmes avec lesquels ils avaient été confrontés auparavant avaient cette solution". D'autres ont salué la conception du framework comme étant "nouvelle". Lorsque la beauté du design a été comprise par des développeurs tiers et même par des étudiants, Yuan Jinhui a ressenti : « C'est comme si vous aviez écrit un roman et que les lecteurs l'appréciaient. »

Et quand Guo Biyang est tombé dans l'anxiété à cause de ChatGPT, cela a C'est lui qui l'a finalement sauvé. Une "connexion entre les gens".

Il a formé un groupe de « chercheurs solitaires en IA » via Zhihu et a découvert que de nombreux collègues vivaient également dans l'ombre de ChatGPT « Sophon ». C'est également là qu'il trouve des collaborateurs sur le projet de détecteur. Après plus de quarante jours de travail acharné, huit personnes ont persévéré dès le début, et personne n’a abandonné, même pendant les moments fous de l’épidémie.

Ils se considèrent comme des chercheurs insignifiants, mais ils espèrent que le travail qu'ils accomplissent est un travail significatif.

Dans un autre coin de Zhihu, une période passionnée partagée par Xie Lingxi a reçu 32 000 likes.

"Combien de temps faudra-t-il à la Chine pour redévelopper des logiciels comme MATLAB et Solidworks ?" Une question qui lui a été posée il y a trois ans lui a fait raconter un événement passé depuis longtemps perdu.

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Il y a plus de dix ans, plusieurs étudiants du département de mathématiques de l'université Tsinghua voulaient créer un logiciel de calcul scientifique capable de rivaliser avec le logiciel de mathématiques le plus utilisé, Mathematica. L'annonce de recrutement a été affichée dans le dortoir du Département d'informatique, mais personne n'y a prêté attention. A cette époque, Xie Lingxi, un junior qui venait d'apprendre Java et qui était passé du département de mathématiques au département d'informatique, a postulé pour nous rejoindre. Après plus de quatre mois de rédaction d’innombrables documents, le prototype était enfin réalisé. Une série d'honneurs a suivi et a finalement remporté le prix spécial national "Challenge Cup".

"Peut-être que notre projet est le meilleur résultat si nous travaillons uniquement avec passion sur des systèmes à grande échelle. Sans un modèle commercial mature ou une écologie saine, le projet ne peut pas continuer longtemps après, Xie Lingxi." La réponse parle de la commercialisation du projet.

"Notre expérience est d'une signification positive. Elle prouve au moins qu'à chaque époque, les jeunes qui osent poursuivre leurs rêves ne manquent pas

3. À la recherche de "millions de trésors"

Yuan Jinhui et First-Class Technology sont classés dans une nouvelle piste - AI grand modèle. Le salaire mensuel minimum proposé pour les postes liés à ChatGPT sur le site de recrutement est de 20 000 et le salaire mensuel maximum proposé est de 100 000. levels.fyi montre qu'OpenAI offre un salaire élevé de 900 000 $ US pour les postes d'IA/ML (L5).

Il semble que du jour au lendemain, nous soyons revenus à l'époque d'il y a six ans où le capital ne parvenait plus à rattraper les docteurs en mathématiques, en informatique et en statistiques les uns après les autres. À cette époque, Zhang Yiming offrait une récompense d'un million de dollars sur Weibo pour recruter les meilleurs talents en apprentissage automatique ; dans la Silicon Valley, certains cadres supérieurs possédant une expertise technique pouvaient gagner un salaire annuel (y compris des incitations en actions) de plusieurs millions s'ils travaillaient pour de grandes sociétés cotées en bourse. des entreprises telles que Google. dollars américains ("Millions of Baby")

A cette époque, afin de former l'équipe d'algorithmes de l'entreprise, Zhihu répondeur Naiyan Wang (Wang Naiyan), qui venait de a obtenu son diplôme et est devenu le scientifique en chef de TuSimple, et a également rejoint cette guerre des talents. Cependant, il a adopté une approche différente et a laissé un message de héros sur Zhihu en répondant « Si vous étiez un intervieweur, comment jugeriez-vous le niveau d'apprentissage profond d'un intervieweur ? » et a affirmé que ces trois questions pourraient tester les « huit réussites » du sujet :

L'application la plus réussie de CNN est le CV, alors pourquoi de nombreux problèmes de PNL et de parole peuvent-ils être résolus à l'aide de CNN ? Pourquoi CNN est-il également utilisé dans AlphaGo ? Quelles sont les similitudes entre ces questions sans rapport ? Comment CNN a-t-elle capturé ce point commun ?

Encore une question, pourquoi de nombreux journaux qui font des grimaces ajoutent-ils une conv locale connectée à la fin.

Ces trois questions ne sont pas des questions typiques des manuels scolaires. Tout comme la conduite autonome de TuSimple est une « nouvelle espèce », l'exploration pionnière nécessite souvent de franchir les frontières. Il n'y a pas de précédent pour référence, encore moins de réponse toute faite. Ce n’est qu’en acquérant un aperçu des liens plus profonds entre des éléments apparemment sans rapport que les ingénieurs en algorithmes peuvent supprimer le faux et conserver le vrai, permettant ainsi aux outils algorithmiques d’être mieux utilisés et de résoudre des problèmes commerciaux réels.

"Il faut dire que c'est une bonne question de sélection." Jia Yangqing, qui était encore un scientifique en intelligence artificielle chez Facebook à l'époque, en a révélé la beauté dans sa réponse : "Cela implique un très question essentielle : pourquoi la convolution peut-elle fonctionner." Répondez à cette question. Il existe de nombreux angles, tels que la régularisation, les statistiques, la programmation et même les neurosciences. Les réponses sous différents angles peuvent refléter l'expérience d'apprentissage profond du sujet sous différents aspects.

Si quelqu'un répond correctement aux trois questions, cela signifie qu'il comprend CNN en ligne et qu'il est la personne que Wang Naiyan recherche.

Les réponses se succèdent et la barre de progression continue de croître. "Proche, mais pas précis", "Fondamentalement fiable ! Les RH vous contacteront plus tard", "Si vous êtes intéressé, envoyez un CV à **", Wang Naiyan répondra aux réponses fondamentalement non pertinentes, mais d'autres réponses sont ci-dessous. Il y avait du silence . Comme prévu, 80 % des gens ne savent pas pourquoi les réseaux de neurones convolutifs fonctionnent. Ils y voient simplement un outil permettant d'exécuter du code open source.

Un master d'une prestigieuse université japonaise a attiré l'attention de Wang Naiyan. "J'ai obtenu mon diplôme de premier cycle à l'Université Tsinghua et je cherchais un emploi après avoir terminé ma maîtrise au Japon. Sa réponse était très proche de ce que je pensais", a déclaré Wang Naiyan. L'entretien qui a suivi s'est également très bien passé et je lui ai immédiatement envoyé une offre. Il s'agit du premier employé ingénieur en algorithmes embauché par TuSimple. Aujourd'hui, il dirige les opérations japonaises de l'entreprise.

Internet a transformé la signification géographique de « à proximité » en une signification numérique de « à proximité ». Vous ne connaissez peut-être pas vos voisins à un pas de là, mais vous avez une grande confiance dans les systèmes abstraits construits avec des technologies complexes, comme Zhihu. Pour de nombreuses véritables équipes entrepreneuriales en IA, lorsqu’elles ont besoin de s’appuyer davantage sur des canaux personnels pour attirer des personnes, c’est souvent un bon choix.

Alors que Wang Naiyan recherchait des ingénieurs en algorithmes, Yuan Jinhui était également avide de talents pour développer des frameworks d'apprentissage profond. Après s'être inscrit sur Zhihu, la première chose que Yuan Jinhui a faite a été de « faire de la publicité » pour son travail. Certaines personnes ont vu les articles et les interactions de Yuan Jinhui et ont réalisé qu'en plus des grandes sociétés Internet, les startups peuvent également réaliser l'architecture sous-jacente. Plusieurs collègues à temps plein dans le domaine de la technologie de premier ordre, y compris des stagiaires, ont ainsi été recrutés à Zhihu.

Le plus souvent, Yuan Jinhui prendra l'initiative. Lorsqu'il verra une réponse intéressante et perspicace, il consultera le Github de l'autre personne pour essayer d'avoir une compréhension plus complète. Même si je n'ai pas réussi à « creuser » certaines de mes personnes préférées, tout le monde est progressivement devenu ami et se réunissait pour échanger des opinions.

Plus vous travaillez longtemps dans votre propre domaine, plus vous écrivez d'articles, plus vous interagissez avec des questions et meilleurs sont les commentaires de la communauté. Un étudiant de premier cycle qui a passé des entretiens pour des postes de stage dans plusieurs entreprises a répondu à la question « Existe-t-il des postes de stage en système ou en compilateur adaptés aux étudiants de premier cycle en Chine ? » :

Parmi eux, je vois que vous possédez la connaissance ultime de la technologie. /poursuite du codage, je pense que oneflow de M. Yuan est une entreprise très approfondie. Au cours de l'entretien, j'ai discuté directement avec l'intervieweur oneflow pendant un après-midi sur le C++ et le calcul parallèle, à partir de diverses techniques d'optimisation telles que SSO, pile/mémoire dynamique. , à divers modèles, programmation de style fonctionnel et certains articles qui critiquent/discréditent certains systèmes ml récents.

Wang Naiyan, qui a toujours été discret, est particulièrement actif sur Zhihu, écrivant des articles et partageant des technologies, et est également un excellent répondant dans les domaines du deep learning, du machine learning et de l'intelligence artificielle. La plupart des fans qui le suivent sont des étudiants en informatique, et beaucoup d'entre eux sont finalement devenus membres de TuSimple grâce au « suivi ». TuSimple compte actuellement de nombreux étudiants de premier cycle occupant des postes en algorithme, ce qui est impossible dans de nombreuses entreprises.

En fait, ils sont très bons. Selon Wang Naiyan, si le modèle de recrutement des grandes sociétés Internet est suivi, certains « joyaux bruts » sans formation glamour ni papiers brillants seront directement éliminés par ces normes strictes.

"Souvent, ce qu'ils ont n'est pas si important. Nous nous soucions davantage des capacités de base et du potentiel de cette personne, de sa réflexion personnelle et de son enthousiasme pour la technologie, même s'il s'agit d'un étudiant de premier cycle ."

Maintenant, Wang Naiyan recherche toujours des talents chez Zhihu. Mais ce qui diffère des débuts de l’entrepreneuriat, c’est que les gens les recherchent de manière plus passive. "Qu'il s'agisse des personnes que je suis, des flux d'informations ou des recommandations, cela m'a aidé à filtrer de nombreuses informations invalides." Wang Naiyan a déclaré : "Les informations vraiment utiles apparaîtront à plusieurs reprises dans le flux d'informations ."

Habituellement, il parcourt des sujets d'actualité, et lorsqu'il voit des réponses intéressantes, il clique pour en savoir plus. Si cela répond aux besoins de l’entreprise, il le transférera au service des ressources humaines.

Peu importe l'évolution de la technologie, les 1 % des personnes les plus performantes ne changeront pas. Leur enthousiasme et leur ferme croyance dans la technologie restent ce qu'ils apprécient le plus.

4. Échos du temps

Après la sortie de ChatGPT, le répondeur de Zhihu "Trinkle" est soudainement apparu sous la question "Comment évaluez-vous le super modèle de conversation d'OpenAI, ChatGPT ?" participer à tout le processus de formation ChatGPT." Et a présenté ses réflexions sur le monde futur :

"Je peux commencer à imaginer le monde après AGI. J'y pense depuis quelques mois..."

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Au bas de la réponse, dans les remerciements sur le site officiel d'OpenAI, "Jiayi Weng" est apparu dans une liste de contributeurs et a été mis en évidence progressivement que "Trinkle" s'appelle Weng Jiayi. . Il est le premier employé diplômé d’OpenAI à détenir une maîtrise au cours des deux dernières années et est également l’un des plus jeunes ingénieurs R&D de l’équipe.

Maintenant, la réponse a reçu plus de 3 000 likes. Peu de gens savent qu'il avait autrefois l'impression de ne pas pouvoir se rapprocher d'OpenAI. "Quand j'ai soumis mon CV après l'obtention de mon diplôme, j'ai aussi pensé que je ne pourrais pas m'en rapprocher."

Weng Jiayi a été exposé à la programmation depuis la première année du collège. À cette époque, l'accent était mis sur l'Olympiade mathématique et l'apprentissage de la programmation consistait simplement à élargir ses idées mathématiques. J'ai vraiment ressenti le charme de la programmation après être entré au lycée n°1 de Fuzhou.

A cette époque, il aimait beaucoup Card Constant. "Étant donné un problème résolu, vous pouvez écrire un tas de code, écrire le même algorithme et avoir la même complexité temporelle, mais je peux coordonner certaines choses pour que le même algorithme s'exécute plus rapidement que d'autres." bon Un sentiment d'accomplissement.

À cette époque, le groupe d'information du collège n°1 de Fuzhou disposait d'un système de jugement interne (JO) pour l'évaluation en ligne, qui contenait divers documents historiques. Weng Jiayi s'arrêtait souvent lorsqu'il se classait premier.

Au cours de sa deuxième année de lycée, Weng Jiayi a complètement changé son orientation, passant des mathématiques à la programmation. Afin de pouvoir participer à la « Reprise des relations diplomatiques entre la dynastie Qing et la Chine du Nord », il décide de participer à l'Olympiade d'informatique. A cette époque, de nombreux étudiants du groupe d'information jouaient à Zhihu, et il a également créé un compte. À cette époque, il n'aurait pas pensé que quelques années plus tard, il deviendrait « le garçon génial qui a commencé à jouer au Zhihu au cours de sa dernière année de lycée » aux yeux de nombreux internautes.

L'année où AlphaGo a vaincu Li Shishi, Weng Jiayi est également entré à l'Université Tsinghua comme il le souhaitait. En raison de ses mauvaises performances à l'Olympiade d'informatique, il a été transféré au département d'informatique en atteignant le top 10 des GPA de l'ensemble du département au cours de sa première année. Je me suis impliqué dans l'apprentissage par renforcement au cours de ma deuxième année.

Lorsqu'il a rencontré le professeur Zhu Jun pour une conversation en tête-à-tête, le professeur Zhu Jun lui a demandé ce qu'il voulait faire ? Il y a trois directions dans le groupe : bayésienne, formation contradictoire et apprentissage par renforcement. Bien qu’il ait choisi l’apprentissage par renforcement, il ne savait pas à l’époque ce qu’était l’apprentissage par renforcement.

"Au début, je pensais que c'était similaire à faire du GAN (entraînement contradictoire)." Après l'avoir choisi, j'ai su que je voulais jouer à des jeux. Pour commencer, il a ensuite joué à de nombreux jeux.

Si au lycée Weng Jiayi plongeait principalement et collectait des informations sur Zhihu, après son entrée à l'Université Tsinghua, il avait davantage envie de partager. Cela est peut-être lié à l'objectif de vie qu'il s'est fixé au lycée : acquérir plus d'influence et aider plus de gens. Tout cela nécessite des connexions avec des machines et des personnes.

Le travail le plus important qu'il a publié sur Zhihu est la bibliothèque d'algorithmes d'apprentissage par renforcement Tianshou (Tienshou) pour son projet de fin d'études senior, qui est également la recherche qui a eu le plus grand impact sur lui jusqu'à présent. Plus tard, j'ai pu travailler en Open AI et j'ai également bénéficié de cette expérience de "premier travail".

La version originale de Tianshou a été écrite par quatre personnes dans le laboratoire il y a deux ans en utilisant Tensorflow. Elle était très lente et personne ne l'utilisait. Il a essayé de refactoriser une partie du code à l’intérieur, mais cela n’a pas fonctionné. Plus tard, j’ai tout abandonné et j’ai recommencé. Il s’avère que les avantages apportés par la rationalisation du framework ne se situent pas seulement au niveau du code, mais également au niveau des performances.

Après la publication de l'œuvre, des internautes aux yeux perçants ont découvert ceci :

« Si le même algorithme tel que dqn+ est également pytorch, pourquoi votre code est-il tellement plus rapide ? deux parties La logique des autres codes est similaire. "

"Le code a aussi une âme (l'évasion, ce sont les détails de mise en œuvre...", a-t-il déclaré. "Cette fois-là m'a vraiment fait comprendre qu'il fallait créer de l'influence. , vous devriez écrire des choses de base ou réaliser des réalisations en ingénierie, plutôt que de réaliser des réalisations dans certains aspects de la recherche. « Il existe de nombreuses choses de mauvaise qualité dans le domaine de l'IA. C'est probablement parce que le chercheur a des capacités d'ingénierie insuffisantes. apportez des connaissances en ingénierie à la recherche, vous obtiendrez des gains différents

En plus d'élargir l'impact de son travail, Weng Jiayi souhaite également participer aux études de premier cycle de l'Université Tsinghua sur des sujets liés à la vie. "Vous regrettez d'avoir choisi d'étudier à l'Université Tsinghua ?" et "Comment se passe une spécialisation en informatique et technologie à l'Université Tsinghua ?" Ces questions ont laissé des traces de sa sortie de la confusion et de sa détermination progressive. Le passé de Xiang Xiang a fait sa réponse est toujours populaire aujourd'hui.

"J'ai l'impression que cette mentalité est exactement ce dont j'ai besoin. Je vais être torturé de façon folle par ta chienne volante." Un ancien élève de Tsinghua a exprimé sa voix intérieure .

"Apprenez à admettre que vous êtes inférieur aux autres et réconciliez-vous avec vous-même." Lorsqu'il était au lycée, il a découvert que peu importe à quel point il travaillait, il y avait toujours quelqu'un qui le méprisait d'un endroit plus élevé, que ce soit c'était les sciences de l'information. L'Olympiade est toujours un cours culturel. C'est la même chose pour les deux premières années d'université. Je ne peux pas comparer avec mes colocataires en anglais. Il y a toujours des gens qui réussissent certains cours qu'ils ne réussissent pas. comprendre sans étudier.

« Vous devez apprendre à définir des indicateurs d'évaluation et arrêter de suivre la foule. " C'est sa suggestion. Au cours de sa première année, Weng Jiayi a complètement changé ses indicateurs d'évaluation et est revenu à son intention initiale. Il Il ne révisait plus sa moyenne et ne « testait » pas à pas ses papiers, préférant faire des travaux « inutiles ». « Mais des choses intéressantes, comme écrire du code. « Quand j'écris un projet personnel, j'ai l'impression de créer une pièce. de l'art." Mon amour pour l'écriture de code et les projets open source a également influencé ma décision d'étudier à l'étranger plus tard. Chaque fois qu'il se rend sur un nouveau site - recrutement de printemps, recrutement d'automne, candidature au doctorat, recherche de stages en Chine - il n'est pas peur de partager son expérience, que ce soit Qingliang qui a plusieurs offres en main, ou que sa candidature au doctorat a été rejetée par « Quanjude » « Sombre, chaque réponse a gagné beaucoup de popularité

Maintenant, Weng Jiayi a contribué 33 réponses, publié 3 articles, accumulé plus de 20 000 abonnés et reçu un total de 28 966 fois D'accord. Ces chiffres quantifient plus ou moins "utilisez votre propre force pour aider plus de gens". réponse "Comment se passe votre recrutement d'automne 2022 ?", il a partagé des centaines d'investissements L'expérience d'une entreprise et écrit à la fin de cette réponse avec près d'un millier de votes positifs, "Le choix est plus grand que l'effort."

Si vous ne prenez pas les décisions optimales en fonction de l'environnement actuel, vous ne participez pas au concours d'informatique et choisissez de vous renforcer. Même si vous ne postulez pas pour étudier à l'étranger ou si vous insistez pour étudier pour un doctorat, est-il possible d'arriver là où vous êtes aujourd'hui ?

Le travail acharné ne peut pas compenser les erreurs dans la prise de décision. Pourquoi Google est-il si loin derrière OpenAI en matière d’IA ? Au cours de l'interview, il a demandé de manière rhétorique, puis a directement répondu : « Parce qu'ils ont choisi une autre direction, une direction différente de celle d'OpenAI.

Récemment, quelqu'un a demandé « Existe-t-il un moyen de rejoindre OpenAI pour la recherche ? " .....Je pense que faire des recherches dans l'entreprise semble être une chose plus efficace. Pouvez-vous me donner quelques suggestions ? "

Il a transmis le lien vers la réponse très appréciée à l'autre partie.

A Zhihu, jai vu les premières lueurs de la transformation de ChatGPT

Le spectaculaire récif corallien est un grand projet sur lequel les polypes coralliens ont travaillé dur pendant de nombreuses années. Les récifs coralliens n’occupent que 0,5 % des fonds marins et océaniques mondiaux, mais abritent plus d’un quart de la vie marine.

À Zhihu, chaque "Zhihuer" technologique est comme un petit polype de corail magique et des zooxanthelles, à travers des questions, des réponses et de l'attention, ils échangent des informations énergétiques entre eux, encore et encore, un système plus avancé est apparu. , attirant des « espèces » technologiques de pointe pour y habiter, y compris certains scientifiques de haut niveau.

Zhihu, vice-président de la stratégie et chef des affaires communautaires, Zhang Ning, a déclaré un jour que le nombre total de personnes engagées dans la recherche scientifique, les études et le travail sur le site s'élève à 5,44 millions dans le domaine de la science et de la technologie. et Internet seul, la production quotidienne moyenne de graphiques et de textes est supérieure à 20 000. Le nombre de réponses, d'articles et de vidéos dans divers domaines tels que les mathématiques, la physique, l'astronomie et l'intelligence artificielle a dépassé le million.

ChatGPT, lorsque des événements de première ligne tels que la sortie de « Wen Xin Yi Yan » de Baidu, la sortie de GPT-4 et l'intégration par Microsoft des fonctions de dialogue de l'IA se sont produits, de grands noms de l'industrie se sont réunis ici pour discutez-en au plus vite.

Le 28 mars, le mathématicien chinois Zhang Yitang a lancé une invitation sur Zhihu : « Je serai invité par l'Université Harvard et plusieurs universités européennes à faire une émission en direct sur le thème : Séquences non positives dans la théorie analytique des nombres et la Zéro de Landau-Siegel (séquence non positive en théorie analytique des nombres et point zéro de Landau-Siegel."

Cette fois, sur Zhihu, vous pouvez à nouveau entendre le son du klaxon.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Java matlab 架构堆事件 github 算法人工智能 cnn tensorflow pytorch oneflow nlp gpt-4 chatgpt 重构 wps gpt mlir agi excel

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Google a annoncé une nouvelle génération de supercalculateur IA, affirmant qu'il est plus rapide et plus économe en énergie que le NVIDIA A100Article suivant：Google a annoncé une nouvelle génération de supercalculateur IA, affirmant qu'il est plus rapide et plus économe en énergie que le NVIDIA A100

Articles Liés

Voir plus