Heim >Technologie-Peripheriegeräte >KI >Das große Modell der KI-Wissenschaftssprache ist sehr beliebt. Sie können mit allen Arten von Mathematik- und Biologiecomputern einfach Code schreiben und Rezensionen schreiben.
KI-Suchmaschine entwickelt sich erneut? !
Geben Sie dieser KI ein Thema und Sie erhalten in wenigen Minuten eine Rezension des Artikels sowie Zitate für den Artikel selbst.
Oder Sie können ein wissenschaftliches Substantiv eingeben und die KI kann schnell eine Wikipedia zu diesem Substantiv erstellen.
Diese KI heißt Galactica (Abkürzung: GAL), das neueste große wissenschaftliche Open-Source-Sprachmodell, das KI in wissenschaftliche Produktivität umwandelt.
Und es wurde auch die „große Vereinheitlichung“ von Disziplinen erreicht, darunter Mathematik, Physik, Computer ... diese KI kann verwendet werden.
Sobald das Modell veröffentlicht wurde, löste es schnell heftige Diskussionen unter den Internetnutzern aus. Derzeit wurden die entsprechenden Tweets fast 150.000 Mal angesehen und die Gesamtzahl der Likes, Retweets und Zitate liegt bei über 5.000.
Der ehemalige technische Leiter von Facebook kam ebenfalls zu seiner Unterstützung.
Einige Internetnutzer haben es persönlich erlebt, und die Literaturrezension, die sie geschrieben haben, „sieht ziemlich gut aus“ und nannte sogar:
# 🎜🎜# Wird es im nächsten Schritt gelingen, neue Ideen zu generieren? Tatsächlich sind das Schreiben von Literaturrezensionen und das Erstellen von Wikipedia nur ein Teil der Aufgaben von GAL. Darüber hinaus kann es auch einige berufliche Fragen beantworten und wissenschaftlich schreiben Code, Annotieren von Molekülen und Proteinen ... Werfen wir einen Blick auf die spezifischen Effekte ~ kann als Werkzeug für die wissenschaftliche Produktion verwendet werdenEs deckt fünf wissenschaftliche Disziplinen ab: maschinelles Lernen, Mathematik, Informatik, Biologie und Physik.
Wählen Sie das Thema aus, geben Sie dann das gesuchte Papierthema in das linke Feld ein, und GAL auf der rechten Seite empfiehlt Ihnen das am besten geeignete Papier Lektüre.
Neben der Empfehlung von Vorträgen hat GAL auch eine praktischere Funktion: das Erstellen von Vorlesungsskripten.
Wenn Sie beispielsweise eine Vorstudie zur Dichtefunktionaltheorie (DFT) machen möchten, aber zu faul sind, eine Vorlesung zu schreiben, können Sie sie einfach GALen und in wenigen Minuten fertigstellen ( manueller Hundekopf).
GAL kann auch zum Annotieren von Molekülen und Proteinen verwendet werden. Im Folgenden finden Sie die Bedienungsanleitung des von GAL generierten RDKit (das molekulare Deskriptoren für Maschinen generieren kann). Lernen).
GAL hat sich auch um einige Details gekümmert!
Wenn Sie beispielsweise einige komplexe mathematische Formeln und Codes nicht verstehen können, können Sie es GAL überlassen, das es direkt für Sie in die Umgangssprache übersetzen kann.
Darüber hinaus kann es auch die Konvertierung zwischen mathematischen Formeln und Codes oder die Konvertierung zwischen verschiedenen Arten von Codes realisieren.
Noch wichtiger ist, dass es auch vereinfachte Formeln und Fehlerprüffunktionen bietet.
Wie geht das?
GAL kann solch komplexe Funktionen erreichen, daher müssen wir seinen Trainingsdatensatz erwähnen.
Offiziellen Quellen zufolge wurde GAL anhand eines neuen hochwertigen wissenschaftlichen Datensatzes namens NatureBook trainiert, der es dem Modell ermöglicht, wissenschaftliche Terminologie, mathematische und chemische Formeln sowie Quellcode zu verwenden.
Enthält mehr als 48 Millionen Aufsätze, Lehrbücher und Vorlesungsskripte sowie Millionen von Verbindungen und Proteinen, wissenschaftliche Websites, Enzyklopädien und mehr.
Neben der Suche nach Artikeln und der Normalisierung von Zitaten enthält der Datensatz von GAL über 360 Millionen kontextbezogene Zitate und über 50 Millionen eindeutige Referenzen, die über verschiedene Quellen hinweg normalisiert wurden.
Nachdem wir einen so großen Datensatz haben, werden wir mit zwei Problemen konfrontiert sein.
Die erste Frage ist, wie diese hochwertigen Datensätze verwaltet werden sollen. Um dies zu erreichen, verwendet GAL zwei Schritte:
Alle Daten werden in einem gemeinsamen Markup-Format verarbeitet und gebrochen Grenzen zwischen Daten aus verschiedenen Quellen abbauen.
Das Vortraining enthält Datensätze für bestimmte Aufgaben, wodurch sichergestellt wird, dass Sie bei der Bewältigung bestimmter Aufgaben professioneller vorgehen können.
Eine weitere Frage ist: Wie gestaltet man die Schnittstelleninteraktion?
Zuallererst kann GAL, wie oben erwähnt, verschiedene Arten von Aufgaben unterstützen.
Daher werden beim Entwerfen von Schnittstelleninteraktionen verschiedene Aufgaben klassifiziert. Verschiedene Klassifizierungen unterstützen unterschiedliche Datentypen.
Da GAL über einen gut verwalteten und qualitativ hochwertigen wissenschaftlichen Datensatz verfügt, wie schneidet es im Vergleich zu anderen Modellen ab?
Daten direkt abrufen!
In Bezug auf das Denken sind die Vorteile von GAL in der Mathematik MMLU (groß angelegtes Multitask-Sprachverständnis) besser als in Chinchilla Palm 540B und GPT-3 175B.
Obwohl GAL nicht auf dem allgemeinen Datensatz trainiert wurde, ist es in GROSS- Bank Die Leistung ist immer noch besser als bei BLOOM und OPT-175B.
Wenn Sie nach dem Lesen einen Juckreiz verspüren, hören Sie bitte zuerst damit auf!
Portal: https://galactica.org/
Referenzlink: [1]https://twitter.com/paperswithcode/status/1592546933679476736[2]https: //github.com/paperswithcode/galai[3]https://galactica.org/static/paper.pdf
Das obige ist der detaillierte Inhalt vonDas große Modell der KI-Wissenschaftssprache ist sehr beliebt. Sie können mit allen Arten von Mathematik- und Biologiecomputern einfach Code schreiben und Rezensionen schreiben.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!