Heim >Technologie-Peripheriegeräte >KI >In Zhihu sah ich das erste Licht der Transformation von ChatGPT

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

王林
王林nach vorne
2023-04-07 23:51:021411Durchsuche

Wenn sich etwas ändert, wird Zhihu eine Antwort haben.

Suchen Sie nach „ChatGPT“, als wären Sie sofort an vorderster Front, wo Sie den Fanfarenruf hören können:

Der Vorsitzende von Sinovation Ventures, Kai-Fu Lee, fasst die allgemeinen Regeln zur Rettung seiner Karriere zusammen in der Post-ChatGPT-Ära;

Andrew Ng, Gründer von DeepLearning.AI Warnung: Stellen Sie ethische und rechtliche Fragen vor Fanatismus; Es muss untersucht werden, wie man von Menschen generierten Text von Text unterscheidet, der von ChatGPT generiert wurde.

Hu Yongze, der Autor von „Digital Survival“ und der School of Journalism and Communication der Peking-Universität, schlug in der Live-Übertragung des Roundtables „Zhichao 8:30“ vor, dass die Entwicklungsrichtung der künstlichen Intelligenz nicht unbedingt „

...

Durch Fragen und Antworten, Themen, runde Tische, Ideen und heiße Live-Übertragungen sind Branchenführer nacheinander in hoher Qualität aufgetreten Die Q&A-Community des chinesischen Internets; Investoren, wissenschaftliche Forscher, Unternehmer und Praktiker vernetzen sich, um alle Grenzen von ChatGPT zu erkunden und über die zukünftigen Auswirkungen ihrer Erkenntnisse nachzudenken.

In nur vier Monaten hat die Popularität des Themas „ChatGPT“ auf Zhihu den Rekord gebrochen, den das Thema „AlphaGo“ seit 2015 aufgestellt hat, mit insgesamt 220.000 Diskussionen und insgesamt 380 Millionen Aufrufen.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Das Thema erfreut sich großer Beliebtheit und auch die Präsentationsmethode ist vielseitig und mehrdimensional.

1. Die Macht der ersten Ankündigung

Am 2. Januar 2023 veröffentlichte ein Informatikstudent der Princeton University GPTZero. Dieses Programm kann „schnell und effektiv“ entschlüsseln, ob der Autor eines Artikels ein Mensch oder ChatGPT ist .

Nachdem er die Nachrichten gesehen hatte, hatte der Zhihu-Antworter „Kaizhu“ das Gefühl, angegriffen zu werden. Am 10. Tag nach dem Start von ChatGPT hat „Grasspod“ Guo Biyang, ein Doktorand im dritten Jahr im AI Lab der School of Information Management and Engineering der Shanghai University of Finance and Economics, bereits mit dieser Arbeit begonnen seine Freunde. „Wir waren tatsächlich die ersten, die mit der Entwicklung des ChatGPT-Detektors begonnen haben“, sagte er.

Mehr als 30.000 Menschen haben GPTZero innerhalb einer Woche nach der Veröffentlichung ausprobiert, und die App stürzte zeitweise ab. Guo Biyang wurde nervös. Ursprünglich war geplant, dass das achtköpfige Team neben dem Detektor auch manuelle Auswertungen und sprachstatistische Analysen durchführt. Natürlich können wir jetzt nicht länger warten.

Nachdem sie mehrere Detektoren mit vorhandenen Datensätzen trainiert hatten, veröffentlichten sie am 11. Januar eine Demo auf Zhihu, dem ersten ChatGPT-Detektor in China. Das Frühlingsfest rückte näher und Guo Biyang, der eigentlich mit seiner Familie plaudern und sich an alte Zeiten erinnern sollte, starrte weiterhin auf den Bildschirm und schenkte niemandem Beachtung. „Meine Familie hat das Gefühl, dass wir vielleicht etwas Großes tun.“

Wir sind in einer Branche tätig, in der die Technologie immer schneller wird. Das Erschreckendste ist nicht, dass die Technologie durchgesickert ist, aber das reicht nicht aus Die Leute verstehen, dass Ihre Technologie mit Ihnen zusammenhängt, ganz zu schweigen vom revolutionären Durchbruch von ChatGPT? In Zhihu sah ich das erste Licht der Transformation von ChatGPT

„Menschen im KI-Kreis möchten ihre Arbeit fördern, und viele Menschen entscheiden sich für Zhihu. Die Arbeit wird von allen verbreitet und es ist für mehr Menschen einfacher, sie zu sehen.“ Das Thema sagte Xie Lingxi, ein ausgezeichneter Befragter, der seit zehn Jahren „altersbewusst“ ist.

Als Guo Biyang und seine Partner gegen die Zeit kämpften, um die Demo zu starten, erschien auch eine Reihe von Arbeiten im Zusammenhang mit ChatGPT auf Zhihu.

PENG Bo, ein ausgezeichneter Antworter zu Themen der künstlichen Intelligenz,

Ein Open-Source-Projekt, das ChatGPT, den Autor von ChatRWKV, offen bewertet, forderte Zhihu auf, mehr Menschen dazu aufzurufen, sich am Aufbau eines Ökosystems zu beteiligen.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Ende Februar wurde ChatExcel, das erste Werk, das natürliche Sprache zur Steuerung von Excel-Arbeiten verwendet, exklusiv auf Zhihu gestartet.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Das daraus resultierende Community-Feedback überraschte Guo Biyang jedoch.

Vor der Veröffentlichung verglichen sie die beiden Detektoren. Da sie anhand des Datensatzes trainiert wurden, war die tatsächliche Wirkung ihres Detektors viel besser als bei GPTZero. Yuan Jinhui, der Gründer von First-Class Technology, sprach auf Zhihu auch darüber, wie man von Menschen generierten Text von Text unterscheiden kann, der von ChatGPT generiert wurde: „Das ist ein dringendes Problem.“ Anfangs gab es viele Meinungen darüber Arbeit war bedeutungslos.

„Wir konzentrieren uns darauf, Fake News zu erkennen, nicht Fake News, die von ChatGPT generiert werden. Wenn ein Klassifikator nur Fake News verarbeiten kann, die von ChatGPT generiert werden, ist es dann nicht vorbei, wenn ich einen Generator wechsle?“

Einige Leute denken auch, dass „wir durch Polieren vermeiden können, als ChatGPT erkannt zu werden.“

Guo Biyang hat beschlossen, persönlich zu antworten. „Man kann sagen, dass unsere Detektoren nicht effektiv sind, aber wenn wir sagen, dass die Detektoren bedeutungslos sind, dann habe ich eine Meinung. Es gibt Gesetzeslücken, und Gesetzlose können die Gesetzeslücken ausnutzen. Tut dies.“ Bedeutet das, dass das Gesetz bedeutungslos ist? Es gibt zehntausend Möglichkeiten, verschiedene Vorschriften zu umgehen, und alles, was wir tun können, ist, die „Kosten der Verantwortungslosigkeit“ zu erhöhen.

Mit der Zeit gibt es immer mehr Stimmen der Unterstützung und Ermutigung.

„Der Wert des Detektors ist von Person zu Person unterschiedlich, aber ich persönlich denke, dass dieser Datensatz wertvoller ist und einige interessante Dinge bewirken kann.“

Hu Naying, ein Forscher in der Abteilung für Content-Technologie des Cloud Institute der China Academy of Information and Communications Technology, sagte in der Live-Übertragung des Zhihu-Roundtables „Zhicha 8:30“, dass Anti-Cheating-Technologie derzeit nicht verfügbar sei So mächtig wie die ChatGPT-Technologie, und es wird unweigerlich ein „Katz-und-Maus“-„Spiel“-Phänomen geben, „aber der Teufel ist immer besser als der Teufel

Tatsächlich entscheiden Sie sich, Ihre Arbeit zu veröffentlichen.“ Zhihu ist gleichbedeutend mit der Entscheidung, in ein komplexes System einzutreten. Die sogenannte Komplexität bedeutet, dass es nicht linear ist und nicht Ihren Erwartungen entspricht. Es hat viele Dimensionen und Variablen und ist daher schwer vorherzusagen. Daher gibt es auch Vorteile sogar unerwartete Überraschungen.

Jetzt hat der Detektor des Guo Biyang-Teams 6.700 Sterne auf Github. Der Datensatz und das Modell wurden möglicherweise Zehntausende Male heruntergeladen und der Artikel wurde in weniger als zwei Monaten 20 Mal zitiert. „Das sind Dinge, an die wir noch nie gedacht haben.“ Er sagte mit einiger Emotion: „(Die Zitationsrate des Artikels) ist schneller als bei allen meinen vorherigen Artikeln.“ Das Team dahinter. Auch über das Open-Source-Projekt ChatRWKV wurde von führenden Technologiemedien berichtet.

Die Komplexität des Zhihu-Systems ist nicht nur unvorhersehbar, sondern beinhaltet auch eine Art Anpassungsfähigkeit. Durch die Veröffentlichung eines Werks wird das System verändert, und das System wird wiederum Ihr Produkt oder Ihre Forschung kalibrieren.

Nachdem das Team von Xie Lingxi im November 2022 ein wichtiges Papier auf der arXiv-Preprint-Website veröffentlicht hatte, wurde es sofort auch auf Zhihu veröffentlicht. Der Titel zeigte ein großes meteorologisches Modell: „Zum ersten Mal die Genauigkeit von mittel- und langfristig.“ Die Wettervorhersagen übertrafen die herkömmlichen Werte

„Der Titel hat mich dazu gebracht, den Originalartikel schnell zu lesen.“ Nachdem er ihn gelesen hatte, drückte ein Internetnutzer seine Wertschätzung für die Leistung des Artikels aus. Nach einer Diskussion mit Teammitgliedern im Kommentarbereich teilte sie ihre Meinung mit:

„Der Input des KI-Modells stammt aus ERA5 (einem aus Beobachtungen und Modellen assimilierten Analysefeld), es nutzt also auch Modellprognosen, und das Modell verfügt nicht über diesen ERA5 (d. h. die Eingabe von KI), daher muss das Modell noch ausgeführt werden, und es gibt derzeit keine unabhängige alternative Modellvorhersage (traditionelle Modellassimilation + KI-Prognose). ) > (traditionelle Modellassimilation + traditionelle Modellvorhersage).“

Das große KI-Modell wird auf ERA5-Daten trainiert. Bei ERA5-Daten handelt es sich um Reanalysedaten, bei denen es sich um einen vollständigen Satz von Reanalysedaten handelt, die hauptsächlich durch Qualitätskontrolle und Assimilationsverarbeitung von Beobachtungsdaten aus verschiedenen Quellen (Boden, Schiffe, Funksondierungen, Windballons, Flugzeuge, Satelliten usw.) gewonnen werden. Datensätze analysieren.

Der Assimilationsprozess besteht hier darin, einige Beobachtungsdaten in standardmäßige gerasterte meteorologische Daten umzuwandeln. Es sollte kein Anspruch erhoben werden, über traditionelle numerische Wettervorhersagemethoden (NWP) hinauszugehen, ohne diese Techniken abzudecken.

„Ja, das dürfte viel Zeit in Anspruch nehmen. Das erste Problem besteht darin, dass es schwierig zu sein scheint, Daten zu erhalten (daher gibt es im In- und Ausland nur sehr wenig entsprechende Arbeit).“

Tatsächlich: „KI kann das noch nicht, oder mit anderen Worten, KI war dazu noch nicht offiziell in der Lage. Der Hauptgrund ist, dass es keine Daten gibt, die Xie Lingxi uns später erklärt hat.“ . Dazu muss die Eingabeseite der KI Daten wie Satelliten und Wetterstationen erhalten, egal in welchem ​​Land sie sich befindet, diese Daten sind streng vertraulich.

„Dank der jahrzehntelangen Bekanntgabe der Assimilationsdaten haben wir diese Arbeit abgeschlossen.“

Bald hat Xie Lingxi die Antwort aktualisiert: „Wir akzeptieren diese Meinung.“ Im Artikel zum groß angelegten meteorologischen Modell von Pangu haben wir NWP auf „Vorhersagemethoden basierend auf assimilierten Daten“ beschränkt, anstatt uns auf den gesamten „Bereich der numerischen Wettervorhersage“ zu beziehen, der zum ersten Mal traditionelle Methoden bei der Assimilation von Daten übertraf Die verwendete Testumgebung ist genau die gleiche wie die von NVIDIA FourCastNet, was die Fairness des Vergleichs und die Glaubwürdigkeit der Schlussfolgerungen gewährleistet Bereitstellung von Berichten der China Meteorological Administration. Sie wurden auch vom Europäischen Meteorologischen Zentrum kontaktiert. Es heißt, dass innerhalb des Europäischen Meteorologischen Zentrums viel darüber diskutiert wird, dass viele bestehende Technologien durch KI ersetzt werden.

Einige Unternehmen haben auch Guo Biyang kontaktiert, um die Möglichkeit zu prüfen, entsprechende Funktionen auf der Textplattform zu starten. Unser Algorithmus verbessert sich immer noch, hauptsächlich durch die Erhöhung der Robustheit des Modells und das Sammeln vielfältigerer Daten, in der Hoffnung, dass das Modell der nächsten Generation effektiver sein wird.

Nachdem Guo Biyang das Feedback von Zhihu-Internetnutzern angenommen hat, wird dies genau das tun Machen Sie das nächste Ziel.

2. Begegnung mit dem „52-Hertz-Wal“

Forscher beeilen sich, ihre Arbeiten auf den Markt zu bringen, und das Kapital „tötet“ auch intensiv KI-Großmodelltalente. Am 27. März um 23 Uhr kam leise eine Nachricht über WeChat: Wang Huiwen und Yuan Jinhui gründeten First-Class Technology und erreichten eine Fusionsabsicht, um eine chinesische Version von OpenAI zu schaffen.

Im Bereich des Large Language Model (LLM), einem Framework, das einst von vielen als das unwichtigste angesehen wurde, ist sein Wert so weit gestiegen, dass Militärstrategen darum konkurrieren müssen. „Jetzt scheint es, dass dies ein inländisches Modell ist, das sich wirklich auf die zugrunde liegende Technologie konzentriert.“ Ein Tencent-KI-Algorithmus-Experte, der verwandte Zhihu-Themen verfolgte, seufzte.

Vor sechs Jahren verließ Yuan Jinhui Microsoft Research Asia, um ein Unternehmen zu gründen, das ein Deep-Learning-Framework entwickelt. Die damalige Situation war nicht anders als die des berühmten „52-Hertz-Wals“.

Durch die Integration von Algorithmusanwendungen und zugrunde liegender Hardware wird das Deep-Learning-Framework als „Betriebssystem für künstliche Intelligenz“ bezeichnet und ist ein Kinderspiel, das sich Startups nicht einmal vorstellen können. Zu dieser Zeit war Googles Deep-Learning-Framework TensorFlow mit seinem enormen Einfluss und seinen starken Werbemöglichkeiten bereits das Deep-Learning-Framework mit den meisten Nutzern (Pytorch steckte noch in den Kinderschuhen).

Google ist ein so großes Unternehmen, bei dem Hunderte von Menschen das Gleiche tun. Wie kann man da mit anderen konkurrieren? Low-Level-Software zu entwickeln, so starke Konkurrenten zu haben und Open Source zu sein ... Was Yuan Jinhui damals am häufigsten hörte, war „mit einem Ei auf einen Stein schlagen“ und „versuchen, den Arm einer Gottesanbeterin als Karren zu benutzen“.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Da die 52-Hz-Frequenz viel höher ist als die aller bekannten Walarten, glauben Wissenschaftler, dass der Schrei eines Wals, der von US-Militärinstrumenten erfasst wurde, von anderen Walen nicht empfangen werden kann.

Der Entwicklungszyklus der Systemsoftware ist sehr lang. Von der Einführung im Jahr 2016 bis Juli 2020 dauerte es vier Jahre, bis das Deep-Learning-Framework OneFlow als Open Source verfügbar war. Da sie dem Druck der hohen Unsicherheit und der Unmöglichkeit jeglichen Feedbacks vor der Veröffentlichung der fertigen Systemsoftware nicht standhalten konnten, traten einige herausragende Kollegen zurück.

Tatsächlich wird es, sobald die Technologie eine so tiefe Ebene im System erreicht, natürlich weniger „Wale“ geben, die mit ihr in Resonanz treten können. In Zhihu fand Yuan Jinhui immer noch Menschen, denen grundlegende Themen genauso am Herzen liegen wie ihm.

Viele Zhihu-Internetnutzer kennen „Teacher Mu“ (Yuan Jinhuis Weibo-Name) aus der Weibo-Ära. „Jinhui schrieb einige besonders interessante Neuigkeiten über Weibo, und alle verbreiteten Gerüchte darüber, wer dieser Typ war, erinnerte sich Yang Jun, technischer Direktor der KI-Rechnerarchitektur von Nvidia.“ Nicht lange nachdem Yuan Jinhui sein Unternehmen gegründet hatte, erwog auch Yang Jun, den Job zu wechseln, und die beiden lernten sich durch Zhihu kennen.

Yuan Jinhui ist der Meinung, dass Yang Jun ein ausgezeichneter Beantworter für Themen des maschinellen Lernens und des Deep Learning ist und das ganze Jahr über qualitativ hochwertige Inhalte herausgebracht hat, und er hat auch von ihm gelernt Ich habe von meinem Denken sehr profitiert.

In Yang Juns Augen ist Yuan Jinhui auch ein relativ leicht zu redender Freund. Yang Jun selbst hat auch die beiden gängigen Deep-Learning-Frameworks vergleichend analysiert und untersucht, warum es zum jetzigen Zeitpunkt immer noch Unternehmen gibt, die bereit sind, enorme Ressourcen in die Entwicklung von KI-Frameworks zu investieren.

Als Google 2019 MLIR veröffentlichte, erregte das Thema Deep-Learning-Compiler damals große Aufmerksamkeit. Die beiden tauchten bald unter der Frage „Was halten Sie von Googles Aufmerksamkeit für das MLIR-Projekt?“ auf und teilten nacheinander ihre Ansichten.

Yuan Jinhui hatte zu dieser Zeit keine große Meinung von MLIR und hielt das Konzept des Compiler-Compilers für etwas überflüssig. MLIR bietet lediglich ein Gerüst zum Schreiben von Deep-Learning-Compilern und löst keine spezifischen Probleme bei Deep-Learning-Compilern.

Yang Jun ist eher geneigt zu glauben, dass MLIR eine gute Sache ist. „Seine Analyse des Beitrags, des Wertes und der Mängel von MLIR hat bis heute einen tiefen Eindruck bei mir hinterlassen.“

Während sich die Überlegungen und Diskussionen vertieften, aktualisierte Yang Jun die ursprüngliche Antwort weiterhin mit neuen Ideen und Gewinnen. Yuan Jinhui behält auch die kognitive Flexibilität bei. Im Jahr 2022 aktualisierte Yuan Jinhui seine ursprüngliche Antwort erneut: „Die Entwicklung in den letzten zwei Jahren zeigt, dass MLIR ein ‚Gerüst‘ bietet … Es ist sehr bedeutungsvoll.“ Ähnliche Geschmäcker können kommunizieren und kollidieren. Yang Jun versuchte, dieses wunderbare Schicksal zu erklären. Wenn Sie beispielsweise Ihre Fragen, Interessen und Artikel verfolgen, können Sie natürlich beurteilen, ob Sie mehr sprechen können.

Nachdem OneFlow als Open Source verfügbar war, „erfuhren einige Internetnutzer plötzlich eine Erleuchtung und stellten fest, dass einige der Probleme, mit denen sie zuvor zu kämpfen hatten, diese Lösung hatten.“ Andere lobten das Framework-Design als „frisch“. Als die Schönheit des Designs von Drittentwicklern und sogar Studenten erkannt wurde, hatte Yuan Jinhui das Gefühl: „Es ist, als hätten Sie einen Roman geschrieben und die Leser würden ihn schätzen

Und als Guo Biyang wegen ChatGPT in Angst geriet, war dies der Fall.“ war derjenige, der ihn schließlich rettete. Eine „Verbindung zwischen Menschen“.

Er gründete über Zhihu eine „Lonely AI Researchers“-Gruppe und stellte fest, dass viele Kollegen auch im Schatten von ChatGPT „Sophon“ lebten. Dort fand er auch Mitarbeiter am Detektorprojekt. Nach mehr als vierzig Tagen harter Arbeit haben acht Menschen durchgehalten und niemand hat aufgegeben, selbst in den verrückten Zeiten der Epidemie.

Sie nennen sich selbst unbedeutende Forscher, aber sie hoffen, dass die Arbeit, die sie leisten, bedeutende Arbeit ist.

In einer anderen Ecke von Zhihu hat eine von Xie Lingxi geteilte leidenschaftliche Zeit 32.000 Likes erhalten.

„Wie lange wird es dauern, bis China Software wie MATLAB und SolidWorks neu entwickelt?“ Eine Frage, die ihm vor drei Jahren gestellt wurde, ließ ihn von einem längst vergessenen vergangenen Ereignis erzählen.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Vor mehr als zehn Jahren wollten mehrere Studenten der Fakultät für Mathematik der Tsinghua-Universität eine wissenschaftliche Computersoftware entwickeln, die mit der am weitesten verbreiteten Mathematiksoftware Mathematica konkurrieren sollte. Die Stellenausschreibung war im Wohnheimgebäude des Fachbereichs Informatik ausgehängt, aber niemand achtete darauf. Zu dieser Zeit bewarb sich Xie Lingxi, ein Junior, der gerade Java gelernt hatte und von der Mathematikabteilung in die Computerabteilung wechselte, um den Beitritt. Nach mehr als vier Monaten des Schreibens unzähliger Dokumente wurde schließlich der Prototyp hergestellt. Es folgten eine Reihe von Ehrungen und schließlich der Gewinn des nationalen Sonderpreises „Challenge Cup“.

„Vielleicht ist unser Projekt das beste Ergebnis, wenn wir nur mit Leidenschaft an Großsystemen arbeiten. Ohne ein ausgereiftes Geschäftsmodell oder eine gesunde Ökologie kann das Projekt nicht lange weitergehen, Xie Lingxi.“ Die Antwort spricht von der Kommerzialisierung des Projekts.

„Unsere Erfahrung ist von positiver Bedeutung. Sie beweist zumindest, dass es zu keiner Zeit an jungen Menschen mangelt, die es wagen, ihre Träume zu verwirklichen.“

3. Auf der Suche nach „Millionen von Schätzen“

Yuan Jinhui und First-Class Technology werden in eine neue Spur eingeteilt – KI-Großmodell. Das monatliche Mindestgehalt, das für ChatGPT-bezogene Stellen auf der Rekrutierungswebsite angeboten wird, beträgt 20.000 und das maximale monatliche Gehalt beträgt 100.000. levels.fyi zeigt, dass OpenAI ein hohes Gehalt von 900.000 US-Dollar für KI/ML-Positionen (L5) bietet.

Es scheint, als wären wir über Nacht in die Ära vor sechs Jahren zurückgekehrt, in der das Kapital nicht mehr nacheinander mit den Doktoranden in Mathematik, Informatik und Statistik mithalten konnte. Damals bot Zhang Yiming auf Weibo eine Belohnung von 1 Million US-Dollar an, um Top-Talente im Bereich maschinelles Lernen im Silicon Valley zu rekrutieren. Einige leitende Manager mit technischem Fachwissen könnten ein Jahresgehalt (einschließlich Aktienanreizen) von Millionen verdienen, wenn sie für große börsennotierte Unternehmen arbeiten würden Unternehmen wie Google. US-Dollar („Millions of Baby“)

Damals, um das Algorithmus-Team des Unternehmens zu bilden, Zhihu-Antworter Naiyan Wang (Wang Naiyan), der gerade schloss sein Studium ab und wurde Chefwissenschaftler von TuSimple. Außerdem schloss er sich dem War for Talents an. Er verfolgte jedoch einen anderen Ansatz und hinterließ einen Heldenbeitrag auf Zhihu, als er antwortete: „Wenn Sie ein Interviewer wären, wie würden Sie das Deep-Learning-Niveau eines Interviewers beurteilen?“ und behauptete, dass diese drei Fragen die „acht Erfolge“ des Probanden testen könnten:

Die erfolgreichste Anwendung von CNN ist der Lebenslauf. Warum können also viele Probleme in NLP und Sprache mithilfe von CNN gelöst werden? Warum wird CNN auch in AlphaGo verwendet? Welche Gemeinsamkeiten gibt es zwischen diesen unabhängigen Fragen? Wie hat CNN diese Gemeinsamkeit erfasst?

Noch eine Frage: Warum fügen viele Face-Making-Zeitungen am Ende einen lokal verbundenen Conv hinzu?

Diese drei Fragen sind keine typischen Lehrbuchfragen. So wie das autonome Fahren von TuSimple eine „neue Spezies“ ist, erfordert die bahnbrechende Erforschung oft das Durchbrechen von Grenzen, geschweige denn eine vorgefertigte Antwort. Nur wenn sie Einblick in die tieferen Zusammenhänge zwischen scheinbar nicht zusammenhängenden Dingen gewinnen, können Algorithmeningenieure das Falsche beseitigen und das Wahre bewahren, sodass algorithmische Tools besser genutzt und reale Geschäftsprobleme gelöst werden können.

„Es sollte gesagt werden, dass es eine gute Screening-Frage ist.“ Jia Yangqing, der damals noch ein Wissenschaftler für künstliche Intelligenz bei Facebook war, verriet in seiner Antwort, „Es handelt sich um eine sehr …“ Wesentliche Frage: Warum kann Faltung funktionieren?“ Beantworten Sie diese Frage Es gibt viele Blickwinkel, wie zum Beispiel Regularisierung, Statistik, Programmierung und sogar Neurowissenschaften. Antworten aus verschiedenen Blickwinkeln können die Deep-Learning-Erfahrung des Subjekts aus verschiedenen Aspekten widerspiegeln.

Wenn jemand grundsätzlich alle drei Fragen richtig beantwortet, bedeutet das, dass er CNN online versteht und die Person ist, nach der Wang Naiyan sucht.

Antworten kommen eine nach der anderen und der Fortschrittsbalken wächst weiter. „Nah, aber nicht korrekt“, „Grundsätzlich zuverlässig! Die Personalabteilung wird sich später mit Ihnen in Verbindung setzen“, „Wenn Sie interessiert sind, senden Sie einen Lebenslauf an **“, wird Wang Naiyan auf grundsätzlich irrelevante Antworten antworten, aber weitere Antworten finden Sie weiter unten. Es herrschte Stille . Wie erwartet wissen 80 % der Menschen nicht, warum Faltungs-Neuronale Netze funktionieren. Sie sehen darin lediglich ein Werkzeug zum Ausführen von Open-Source-Code.

Ein Master-Abschluss an einer renommierten japanischen Universität erregte Wang Naiyans Aufmerksamkeit. „Ich habe meinen Bachelor-Abschluss an der Tsinghua-Universität gemacht und war nach Abschluss meines Master-Studiums in Japan auf der Suche nach einem Job. Seine Antwort kam meinen Vorstellungen sehr nahe“, sagte Wang Naiyan. Auch das anschließende Gespräch verlief sehr gut und ich habe ihm sofort ein Angebot geschickt. Dies ist der erste von TuSimple eingestellte Mitarbeiter eines Algorithmeningenieurs. Heute leitet er die Japanaktivitäten des Unternehmens.

Das Internet hat die geografische Bedeutung von „in der Nähe“ in eine digitale Bedeutung von „in der Nähe“ umgewandelt. Sie kennen Ihre Nachbarn vielleicht nicht einen Schritt entfernt, aber Sie haben ein hohes Maß an Vertrauen in abstrakte Systeme, die mit komplexen Technologien aufgebaut sind, wie z. B. Zhihu. Für viele echte KI-Unternehmerteams ist dies oft eine gute Wahl, wenn sie sich mehr auf persönliche Kanäle verlassen müssen, um Leute zu gewinnen.

Während Wang Naiyan nach Algorithmus-Ingenieuren suchte, suchte Yuan Jinhui auch nach Talenten für die Entwicklung von Deep-Learning-Frameworks. Nach der Registrierung bei Zhihu war das erste, was Yuan Jinhui tat, ihre Arbeit zu „bewerben“. Einige Leute sahen die Artikel und Interaktionen von Yuan Jinhui und stellten fest, dass neben großen Internetunternehmen auch Startups die zugrunde liegende Architektur erstellen können. Auf diese Weise wurden mehrere Vollzeitkollegen im erstklassigen Technologiebereich, darunter auch Praktikanten, von Zhihu rekrutiert.

Häufiger ergreift Yuan Jinhui die Initiative. Wenn er eine interessante und aufschlussreiche Antwort sieht, wird er den Github der anderen Person überprüfen, um zu versuchen, ein umfassenderes Verständnis zu erlangen. Auch wenn es mir nicht gelang, einige meiner Lieblingsmenschen zu finden, wurden alle nach und nach Freunde und trafen sich, um einige Meinungen auszutauschen.

Je länger Sie in Ihrem eigenen Bereich arbeiten, desto mehr Artikel schreiben Sie, desto mehr interagieren Sie mit Fragen und desto besser ist das Community-Feedback. Ein Student, der sich für Praktikumsstellen in mehreren Unternehmen beworben hat, antwortete auf die Frage „Gibt es in China geeignete System- oder Compiler-Praktikumsstellen für Bachelor-Studenten?“:

Dabei sehe ich, dass Sie über die ultimativen Technologiekenntnisse verfügen /Coding Pursuit, ich denke, dass Oneflow von Herrn Yuan ein sehr tiefgründiges Unternehmen ist. Während des Interviews unterhielt ich mich einen Nachmittag lang direkt mit dem Oneflow-Interviewer über C++ und Parallel Computing, von verschiedenen Optimierungstechniken wie SSO, Stack/Dynamic Memory , bis hin zu verschiedenen Vorlagen, Programmierung im funktionalen Stil und einigen Artikeln, die einige neuere ML-Systeme kritisieren/diskreditieren.

Wang Naiyan, der immer zurückhaltend war, ist besonders aktiv auf Zhihu, schreibt Artikel und teilt Technologie und ist auch ein hervorragender Befragter in den Bereichen Deep Learning, maschinelles Lernen und künstliche Intelligenz. Viele der Fans, die ihm folgen, sind Informatikstudenten, und viele von ihnen wurden schließlich durch „Folgen“ Mitglieder von TuSimple. TuSimple hat derzeit viele Studenten in Algorithmenpositionen, was in vielen Unternehmen unmöglich ist.

Eigentlich sind sie sehr gut. Wang Naiyan ist der Ansicht, dass, wenn man dem Rekrutierungsmodell großer Internetunternehmen folgt, einige „ungeschliffene Juwelen“ ohne einen glamourösen Bildungshintergrund oder glänzende Papiere direkt von diesen strengen Standards ausgeschlossen werden.

„Oft ist es nicht so wichtig, was sie haben. Wir legen mehr Wert auf die grundlegenden Fähigkeiten und das Potenzial dieser Person, ob sie über Selbstdenken und Begeisterung für Technologie verfügt, auch wenn sie ein Student ist.“

Jetzt sucht Wang Naiyan immer noch nach Talenten aus Zhihu. Der Unterschied zur Anfangsphase des Unternehmertums besteht jedoch darin, dass die Menschen eher passiv danach suchen. „Ob es die Personen sind, denen ich folge, Informationsströme oder Empfehlungen, es hat mir geholfen, viele ungültige Informationen herauszufiltern.“ Wang Naiyan sagte: „Wirklich nützliche Informationen werden immer wieder im Informationsstrom auftauchen.“

Normalerweise durchstöbert er einige aktuelle Themen, und wenn er interessante Antworten sieht, klickt er hinein, um mehr zu erfahren. Wenn es den Bedürfnissen des Unternehmens entspricht, übergibt er es an die Personalabteilung.

Egal wie sich die Technologie weiterentwickelt, die Top1 % der Menschen werden sich nicht ändern. Ihr Enthusiasmus und ihr fester Glaube an die Technologie sind immer noch das, was sie am meisten schätzen.

4. Echos der Zeit

Nach der Veröffentlichung von ChatGPT tauchte der Zhihu-Antworter „Trinkle“ plötzlich unter der Frage „Wie bewerten Sie das Super-Konversationsmodell ChatGPT von OpenAI?“ auf und gab bekannt, dass er „das Glück hatte.“ Nehmen Sie am gesamten Prozess des ChatGPT-Trainings teil.

Am Ende der Antwort, in den Danksagungen auf der offiziellen Website von OpenAI, erschien „Jiayi Weng“ in einer Liste der Mitwirkenden und wurde nach und nach hervorgehoben, dass „Trinkle“ Weng Jiayi heißt . Er ist der erste OpenAI-Mitarbeiter mit einem Master-Abschluss in den letzten zwei Jahren und außerdem einer der jüngsten F&E-Ingenieure im Team.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

Mittlerweile hat die Antwort mehr als 3.000 Likes erhalten. Nur wenige Menschen wissen, dass er einmal das Gefühl hatte, dass er OpenAI nicht nahe kommen könne: „Als ich meinen Lebenslauf nach dem Abschluss einreichte, dachte er, dass ich nicht in die Nähe kommen könnte.“

Weng Jiayi ist seit der ersten Klasse der Mittelschule mit dem Programmieren in Kontakt gekommen. Damals lag der Schwerpunkt auf der Mathematikolympiade und das Erlernen des Programmierens diente lediglich dazu, seine mathematischen Ideen zu erweitern. Ich habe den Reiz des Programmierens wirklich gespürt, nachdem ich in der High School die Mittelschule Nr. 1 in Fuzhou besucht habe.

Card Constant gefiel ihm damals sehr gut. „Angesichts eines behobenen Problems kann man eine Menge Code schreiben, den gleichen Algorithmus schreiben und die gleiche Zeitkomplexität haben, aber ich kann einige Dinge koordinieren, damit derselbe Algorithmus schneller läuft als andere.“ gut Ein Erfolgserlebnis.

Zu dieser Zeit verfügte die Informationsgruppe der Mittelschule Nr. 1 in Fuzhou über ein internes Beurteilungssystem (OJ) für die Online-Bewertung, das verschiedene historische Aufzeichnungen enthielt, die häufig aufhörten, wenn er den ersten Platz belegte.

In seinem zweiten Jahr an der High School verlagerte Weng Jiayi seinen Fokus komplett von Mathematik auf Programmierung. Um an der „Wiederaufnahme der diplomatischen Beziehungen zwischen der Qing-Dynastie und Nordchina“ teilnehmen zu können, entschloss er sich zur Teilnahme an der Informatikolympiade. Zu dieser Zeit spielten viele Schüler der Informationsgruppe Zhihu und er registrierte auch ein Konto. Damals hätte er nicht gedacht, dass er ein paar Jahre später in den Augen vieler Internetnutzer „der geniale Junge werden würde, der in seinem Abschlussjahr an der High School anfing, Zhihu zu spielen“.

In dem Jahr, in dem AlphaGo Li Shishi besiegte, trat auch Weng Jiayi auf Wunsch in die Tsinghua-Universität ein. Aufgrund seiner schlechten Leistungen bei der Informatikolympiade wechselte er in die Informatikabteilung, wo er in seinem ersten Studienjahr die besten zehn Notendurchschnitte in der gesamten Abteilung erreichte. Während meines zweiten Studienjahres beschäftigte ich mich mit Reinforcement Learning.

Als er Professor Zhu Jun zu einem Einzelgespräch traf, fragte ihn Professor Zhu Jun, was er tun wollte? In der Gruppe gibt es drei Richtungen: Bayesianisches, kontradiktorisches Training und verstärkendes Lernen. Obwohl er sich für Reinforcement Learning entschied, wusste er zu diesem Zeitpunkt nicht, was Reinforcement Learning war.

„Zuerst dachte ich, es wäre ähnlich wie GAN (Gegnertraining). Nachdem ich mich dafür entschieden hatte, wusste ich, dass ich Spiele spielen wollte. Zu Beginn spielte er später viele Spiele.

Wenn Weng Jiayi in der High School hauptsächlich tauchte und Informationen über Zhihu sammelte, verspürte er nach dem Eintritt in die Tsinghua-Universität mehr Lust, sie zu teilen. Vielleicht hängt das mit dem Lebensziel zusammen, das er sich in der High School gesetzt hat – mehr Einfluss zu gewinnen und mehr Menschen zu helfen. All dies erfordert Verbindungen zu Maschinen und Menschen.

Die wichtigste Arbeit, die er auf Zhihu veröffentlicht hat, ist die Bibliothek für Reinforcement-Learning-Algorithmen Tianshou (Tienshou) für sein Abschlussprojekt, das auch die Forschung ist, die bisher den größten Einfluss auf ihn hatte. Später durfte ich im Bereich Open AI arbeiten und profitierte auch von dieser „ersten Arbeitserfahrung“.

Die Originalversion von Tianshou wurde vor zwei Jahren von vier Personen im Labor mit Tensorflow geschrieben. Sie war sehr langsam und wurde von niemandem verwendet. Er hat versucht, einen Teil des darin enthaltenen Codes umzugestalten, aber es hat nicht funktioniert. Später habe ich einfach alles verworfen und von vorne angefangen. Es stellt sich heraus, dass die Vorteile der Rationalisierung des Frameworks nicht nur auf der Codeebene, sondern auch auf der Leistungsebene liegen.

Nachdem die Arbeit veröffentlicht wurde, entdeckten scharfäugige Internetnutzer Folgendes:

„Wenn derselbe Algorithmus wie dqn+ auch Pytorch ist, warum ist Ihr Code dann so viel schneller? Es fühlt sich an, als wären diese außer diesen „Die Logik anderer Codes ist ähnlich.“ , Sie sollten einige grundlegende Dinge schreiben oder Erfolge im Ingenieurwesen erzielen, anstatt in einigen Forschungsaspekten Erfolge zu erzielen. „Es gibt viele Dinge von geringer Qualität im KI-Bereich. Dies liegt wahrscheinlich daran, dass der Forscher nicht über ausreichende technische Fähigkeiten verfügt.“ Wenn Sie einige technische Erkenntnisse in die Forschung einbringen, werden Sie unterschiedliche Vorteile haben. Weng Jiayi möchte nicht nur die Wirkung seiner Arbeit erweitern, sondern auch an lebensbezogenen Themen der Tsinghua-Universität teilnehmen „Bereuen Sie die Entscheidung, an der Tsinghua-Universität zu studieren?“, „Wie ist es, Informatik und Technologie an der Tsinghua-Universität zu studieren?“ Diese Fragen haben Spuren hinterlassen, wie er aus der Verwirrung herauskam und nach und nach fester wurde. Xiang Xiangs Vergangenheit hat ihn geprägt Antwort ist auch heute noch beliebt.

„Ich habe das Gefühl, dass diese Mentalität genau das ist, was ich brauche. Ich werde von deiner fliegenden Schlampe verrückt gemacht.“ „Lernen Sie zuzugeben, dass Sie anderen unterlegen sind, und versöhnen Sie sich mit sich selbst.“ In der High School entdeckte er, dass es, egal wie hart er arbeitete, immer jemanden gab, der von einer höheren Stelle auf ihn herabblickte, sei es in der Informatik. Die Olympiade ist immer noch ein Kulturkurs. Das Gleiche gilt für die ersten beiden Studienjahre. Es gibt immer Leute, die einige Kurse nicht verstehen, ohne sie zu lernen

„Sie müssen lernen, Bewertungsindikatoren zu definieren und aufhören, der Masse zu folgen.“ Das ist sein Vorschlag. In seinem Juniorjahr änderte Weng Jiayi seine Bewertungsindikatoren komplett und kehrte zu seiner ursprünglichen Absicht zurück. Er hat seine nicht mehr aufgefrischt GPA und „getestete“ Arbeiten Schritt für Schritt, lieber einige „nutzlose“ Arbeiten erledigen, aber interessante Dinge, wie zum Beispiel das Schreiben von Code. „Wenn ich ein persönliches Projekt schreibe, habe ich das Gefühl, ein Kunstwerk zu schaffen.“ Mein Die Liebe zum Schreiben von Code und zu Open-Source-Projekten beeinflusste auch meine Entscheidung, später im Ausland zu studieren – jedes Mal, wenn er eine neue Website besucht – Rekrutierung im Frühjahr, Rekrutierung im Herbst, Bewerbung für eine Promotion, Suche nach Praktikumsstellen in China – scheut er sich nicht, seine Erfahrungen zu teilen , sei es Qingliang, der mehrere Angebote in der Hand hat, oder ob sein Doktorandenantrag von „Quanjude“ abgelehnt wurde „Düster, jede Antwort hat große Popularität erlangt

Jetzt hat Weng Jiayi 33 Antworten beigesteuert, 3 veröffentlicht Artikel, die mehr als 20.000 Follower haben und insgesamt 28.966 Mal empfangen wurden. Diese Zahlen quantifizieren mehr oder weniger: „Nutzen Sie Ihre eigene Kraft, um mehr Menschen zu helfen.“ Unter der Frage und Antwort „Wie geht es Ihnen?“ „Herbstrekrutierung 2022 im Gange?“, teilte er Hunderte von Investitionen mit Die Erfahrung eines Unternehmens und schrieb am Ende dieser Antwort mit fast tausend Upvotes: „Auswahl ist größer als Anstrengung.“

Wenn nicht Treffen Sie auf der Grundlage des aktuellen Umfelds die optimalen Entscheidungen, nehmen Sie nicht am Informatikwettbewerb teil und entscheiden Sie sich für eine Stärkung. Auch wenn Sie sich nicht für ein Studium im Ausland bewerben oder darauf bestehen, einen Doktortitel zu erwerben, ist dies möglich Wo bist du heute?

Harte Arbeit kann Fehler bei der Entscheidungsfindung nicht ausgleichen. Warum hinkt Google in Sachen KI so weit hinter OpenAI zurück? Während des Interviews fragte er rhetorisch und gab dann direkt die Antwort: „Weil sie eine andere Richtung gewählt haben, eine andere Richtung als OpenAI.“ Kürzlich fragte jemand: „Gibt es eine Möglichkeit, sich OpenAI für die Forschung anzuschließen?“ „ .....Ich denke, Recherche im Unternehmen scheint effektiver zu sein. Können Sie mir einige Vorschläge machen?“

Er leitete den Link zu der hochgelobten Antwort an die andere Partei weiter.

Das spektakuläre Korallenriff ist ein großes Projekt, an dem die Korallenpolypen viele Jahre lang hart gearbeitet haben. Korallenriffe bedecken nur 0,5 % des globalen Meeresbodens und Meeresbodens, beherbergen aber mehr als ein Viertel aller Meereslebewesen.

In Zhihu sah ich das erste Licht der Transformation von ChatGPT

In Zhihu ist jeder technologische „Zhihuer“ wie ein kleiner und magischer Korallenpolyp und Zooxanthellen. Durch Fragen, Antworten und Aufmerksamkeit tauschen sie immer wieder Energieinformationen aus, wodurch ein fortschrittlicheres System entsteht , was weitere hochmoderne technologische „Spezies“ anzieht, darunter einige Spitzenwissenschaftler.

Zhihu-Vizepräsident für Strategie und Community Business Leader Zhang Ning sagte einmal, dass die Gesamtzahl der Menschen, die auf der Website wissenschaftlich forschen, studieren und arbeiten, im Bereich Wissenschaft und Technologie bis zu 5,44 Millionen beträgt Allein im Internet beträgt die durchschnittliche tägliche Ausgabe von Grafiken und Texten mehr als 20.000. Die Zahl der Antworten, Artikel und Videos in verschiedenen Bereichen wie Mathematik, Physik, Astronomie und künstlicher Intelligenz hat 1 Million überschritten.

ChatGPT, als Ereignisse an vorderster Front wie die Veröffentlichung von Baidus „Wen Xin Yi Yan“, die Veröffentlichung von GPT-4 und die Integration von KI-Dialogfunktionen durch Microsoft stattfanden, versammelten sich hier große Namen der Branche Besprechen Sie es so schnell wie möglich.

Am 28. März veröffentlichte der chinesische Mathematiker Zhang Yitang eine Einladung zu Zhihu: „Ich werde von der Harvard University und mehreren europäischen Universitäten eingeladen, eine Live-Übertragung mit dem Thema: Nichtpositive Sequenzen in der analytischen Zahlentheorie und dem.“ Landau-Siegel-Nullpunkt (nicht positive Folge in der analytischen Zahlentheorie und Landau-Siegel-Nullpunkt).

Das obige ist der detaillierte Inhalt vonIn Zhihu sah ich das erste Licht der Transformation von ChatGPT. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen