Heim >Technologie-Peripheriegeräte >KI >Die Nachfrage nach Rechenleistung ist im Zuge der Welle großer KI-Modelle explodiert. „Großes Modell + große Rechenleistung' von SenseTime ermöglicht die Entwicklung mehrerer Branchen.
Kürzlich fand die „Lingang New Area Intelligent Computing Conference“ mit dem Thema „KI führt die Ära an, Rechenleistung treibt die Zukunft“ statt. Bei dem Treffen wurde die New Area Intelligent Computing Industry Alliance offiziell als Anbieter von Rechenleistung gegründet. Gleichzeitig wurde SenseTime der Titel „New Area Intelligent Computing Industry Chain Master“ verliehen.
Als aktiver Teilnehmer am Lingang-Rechenleistungs-Ökosystem hat SenseTime derzeit eine der größten intelligenten Computerplattformen in Asien aufgebaut – SenseTime AIDC, die eine Gesamtrechenleistung von 5.000 Petaflops ausgeben und 20 Projekte mit Hunderten von Milliarden Parametern unterstützen kann. Sehr große Modelle werden gleichzeitig trainiert. SenseCore, ein auf AIDC basierendes und zukunftsorientiertes Großgerät, hat sich zum Ziel gesetzt, eine hocheffiziente, kostengünstige und groß angelegte KI-Infrastruktur und -Dienste der nächsten Generation zu schaffen und so ein neues Paradigma der Produktion künstlicher Intelligenz zu ermöglichen wird in der AGI-Ära zu einem Infrastrukturdienstleister.
Unter der Welle großer KI-Modelle ist der Bedarf an Rechenleistung explodiert
Zu den drei Hauptelementen der künstlichen Intelligenz gehören hauptsächlich Daten, Algorithmen und Rechenleistung. Laut kürzlich von OpenAI veröffentlichten Daten ist die Rechenleistung, die für Trainingsaufgaben im Bereich der künstlichen Intelligenz eingesetzt wird, seit 2012 exponentiell gestiegen, wobei sich die Wachstumsrate alle 3,5 Monate verdoppelt. Bisher ist der Bedarf der Menschen an Rechenleistung um mehr als das 300.000-fache gestiegen. Die Popularität von ChatGPT hat neue Marktanforderungen an Rechenleistung ausgelöst.
Derzeit wächst der Rechenleistungsmarkt meines Landes weiter. Nach Schätzungen der Akademie für Informations- und Kommunikationstechnologie wird der Gesamtumfang der Rechenleistung der Computerausrüstung meines Landes im Jahr 2021 202 EFlops erreichen, was einer Wachstumsrate von etwa 50 % entspricht. , was höher ist als die globale Wachstumsrate.
In diesem Zusammenhang nutzt Shanghai Lingang aktiv die Vorteile und die ökologische Traktion der lokalen Computerindustrie und hat den „Lingang New Area Action Plan to Accelerate the Construction of a Computing Industry Ecosystem“ (im Folgenden als „Plan“ bezeichnet) veröffentlicht.
Berichten zufolge hat die Rechenleistungsbranche in der Lingang New Area entsprechende Vorkehrungen für Upstream-Software und -Hardware, Midstream-Rechenzentren, Dispatching-Plattformen und Downstream-Anwendungen getroffen. Derzeit übersteigt die Gesamtrechenleistung von Lingang 3EFLOPS (FP32). Der Anteil der intelligenten Rechenleistung beträgt fast 80 %, und die gesamte Rechenleistung macht fast 20 % von Shanghai aus.
Der „Plan“ sieht vor, dass die Lingang New Area bis 2025 ein diversifiziertes Rechenleistungssystem bilden wird, das sich auf intelligente Rechenleistung konzentriert und grundlegende Rechenleistung und Supercomputing-Leistung koordiniert. Die Gesamtrechenleistung übersteigt 5EFLOPS (FP32), AI Der Anteil Die Rechenleistung hat 80 % erreicht, und der Gesamtumfang der Rechenleistungsbranche hat 10 Milliarden Yuan überschritten. Es wurde eine öffentliche Rechenleistungsdienstplattform aufgebaut, der Rechenleistungshandelsmechanismus wurde standardisiert und eine regionale Rechenleistungsplanung wurde realisiert. und es wurde ein Cluster für die Rechenleistungsindustrie mit nationalem Einfluss aufgebaut. Eine Reihe von Benchmark-Szenarien für Rechenleistungsanwendungen.
Xu Li, Vorsitzender und CEO von SenseTime, sagte, dass die Rechenleistung die Energiequelle der neuen Ära sei. In gewissem Maße bestimme die Rechenleistung die Wettbewerbsfähigkeit des Marktes. „Rechenleistung ist ein Ausdruck der Fähigkeiten des gesamten Modells, die gleich den Parametern des Algorithmus oder großen Modells multipliziert mit der Datenmenge ist, die es verarbeitet. Im Zeitalter großer Modelle gilt: Je größer die Parameter, desto größer die Menge.“ Daten vervielfachen sich und desto größer ist die erforderliche Rechenleistung.“
Gleichzeitig wurde die Lingang New Area Intelligent Computing Industry Alliance offiziell gegründet. Die Mitglieder der Industrieallianz werden durch 25 Unternehmen und 3 Universitäten und Forschungsinstitute vertreten durchgeführt, um neue Filme zu fördern. Der Einsatz der intelligenten Computerindustrie im Bezirk fördert die wirtschaftliche Entwicklung.
SenseTime wurde mit dem Titel „Chain Leader of the Intelligent Computing Industry Chain in the New Area“ ausgezeichnet. Das SenseTime Intelligent Computing Center in der Lingang New Area trägt die wichtige Aufgabe, groß angelegte Forschung und Entwicklung im Bereich der künstlichen Intelligenz sowie Industrialisierung durchzuführen im Jangtse-Delta und wird sich in Zukunft aktiv an der kollaborativen Integration und Clusterentwicklung der intelligenten Computerindustriekette beteiligen.
Großes Modell + Innovation bei der Integration großer Rechenleistung
Die Integration großer Modelle und großer Rechenleistung führt zu einem großen Wandel im Produktionsparadigma und treibt wissenschaftliche Forschung und industrielle Anwendungen in die Ära der allgemeinen künstlichen Intelligenz (AGI), die durch intelligentes Rechnen vorangetrieben wird. In den frühen Phasen der schnellen Technologieiteration muss die Branche dringend eine neue Generation von Infrastruktur aufbauen, um die Anwendungsschwellen zu senken, F&E-Zyklen zu verkürzen und die Innovationseffizienz zu verbessern.
SenseTime Technology legte seine Pläne im Voraus dar und verbrachte fünf Jahre mit dem Aufbau von SenseCore, einem großen Gerät von SenseTime. Auf dieser Grundlage baute es das große Modellsystem „SenseTime New SenseNova“ auf, um der Industrie große Modellalgorithmusdienste, Schulungen und andere bereitzustellen Inferenz. AGI-Infrastruktur, die Software und Hardware wie Optimierung und Datendienste kombiniert.
Berichten zufolge nutzt SenseCore, ein großes Gerät von SenseTime, das SenseTime Artificial Intelligence Computing Center (bezeichnet als „SenseTime Intelligent Computing Center oder SenseTime AIDC“) als Rechenleistungsbasis. Es enthält 27.000 GPUs und kann eine Gesamtrechenleistung ausgeben Leistung von 5.000 Petaflops Mit branchenführender Rechenleistung, extrem großem Modelltraining und umfangreichen Argumentationsfunktionen ist es derzeit eine der größten intelligenten Computerplattformen in Asien.
Die aktuelle Rechenleistung von SenseCore, einem großen Gerät von SenseTime, kann das gleichzeitige Training von 20 extrem großen Modellen mit Hunderten von Milliarden Parametern unterstützen und bietet ein umfassendes Servicesystem für die Infrastruktur großer Modelle, das Daten, Trainingstools und Inferenzen abdeckt Bereitstellung und Leistungsoptimierung.
Das große Gerät von SenseTime verfügt über hervorragende parallele Rechenfunktionen und kann ein Einzelaufgaben-Training mit einem Cluster im Maximalmaßstab von 3200 Karten durchführen und ein ununterbrochenes, stabiles Training für mehr als sieben Tage erreichen. Es unterstützt nicht nur die eigenen großen Modelltrainingsprojekte von SenseTime, sondern auch Schulungen Modelle, die von anderen Unternehmen angepasst wurden.
Darüber hinaus integrieren SenseTime-Großgeräte die Kernfunktionen von KI, Supercomputing und Big Data. Durch Hochleistungsrechnen, Hochleistungsspeicher und -caching sowie für KI optimierte Hochleistungsnetzwerke wird eine Trennung von Speicher und Rechenleistung erreicht , große Elastizität und fehlertolerante Planung und andere Funktionen, die große Modelle auf Tausenden von Karten und Speicher auf PB-Ebene unterstützen, um das Training großer Modelle mit Billionen von Parametern abzuschließen.
SenseCore AI-Plattformprodukte bieten außerdem modulare, vollständige Datenketten-, Trainings- und Argumentationsfunktionen. Es kann zig Milliarden Datenverwaltungs- und -abrufdienste sowie manuelle Anmerkungsdienste realisieren und die Effizienz der Entwicklung großer KI-Modelle beschleunigen. One-Click-Quantifizierung, One-Click-Deployment und One-Click-Anwendung bieten Tools für die schnelle Online-Verifizierung großer Modelle und beschleunigen Innovationen.
Darüber hinaus stellt Big Device Kunden und ökologischen Partnern auch MaaS-Großmodell-as-a-Service mit vollständiger Kette zur Verfügung und beschleunigt so die Innovation und Anwendungseffizienz großer Modelle.
Unter anderem kann der automatisierte Datenanmerkungsdienst die Effizienz der intelligenten Annotation um das Hundertfache steigern; der große Modellinferenzbereitstellungsdienst kann die Effizienz der großen Modellinferenz um 600 % steigern; der große Modellparalleltrainingsdienst unterstützt einzelne Cluster-3200-Karten 500 Milliarden dichtes Parametermodelltraining; große Modellsteigerung Der Volumentrainingsservice kann die inkrementellen Feinabstimmungskosten um 90 % reduzieren.
Das große SenseTime AI-Modell ermöglicht die branchenübergreifende Entwicklung
Durch große Geräte hat SenseTime eine rasante Entwicklung im Bereich großer Modelle erzielt.
Laut Xu Li hat das multimodale Großmodell „Scholar 2.5“, das im März dieses Jahres als Open Source veröffentlicht wurde, die Führung in mehr als 20 maßgeblichen Datensätzen in den drei gängigen visuellen Aufgaben Erkennung, Segmentierung und Klassifizierung übernommen Bietet Möglichkeiten für autonomes Fahren, Roboter usw. Gemeinsame Szenenaufgaben bieten effiziente und genaue Unterstützung für Wahrnehmungs- und Verständnisfähigkeiten.
Für die Grundlagenforschung der künstlichen Intelligenz (AI For Science) ist die globale mittelfristige Wettervorhersage neben meteorologischen und klimatischen Vorhersageaufgaben eine der wichtigsten Vorhersageaufgaben. Das im April dieses Jahres eingeführte große globale mittelfristige Wettervorhersage-KI-Modell „Fengwu“ erzielte erstmals eine effektive Vorhersage zentraler atmosphärischer Variablen mit hoher Auflösung für mehr als 10 Tage und übertraf das GraphCast-Modell in 80 % der Bewertungsindikatoren . Dank hochauflösender globaler atmosphärischer Datenmodellierung kann „Fengwu“ auch extreme Wetterereignisse wie Taifune simulieren und die Flugbahn von Taifunen genau vorhersagen.
UniAD, die branchenweit erste von SenseTime entwickelte End-to-End-Lösung für autonomes Fahren mit integrierter Wahrnehmung und Entscheidungsfindung, übertrifft die SOTA-Methode in einer Reihe wichtiger Datensätze und Indikatoren und verbessert die Genauigkeit der Spurlinienvorhersage um 30 % sowie die Bewegungsvorhersage Der Verschiebungsfehler wird um fast 40 % und der Planungsfehler um fast 30 % reduziert.
Darüber hinaus verfügt das im letzten Monat von SenseTime eingeführte große Fernerkundungsmodell SenseEarth 3.0 nicht nur über die umfassendsten Interpretationskategorien in der Branche, sondern hat auch technologische Durchbrüche bei vielen Indikatoren wie Interpretationseffizienz, Generalisierungsfähigkeit und Interpretationsgenauigkeit erzielt.
Xu Li sagte: „In der AGI-Ära kann die Fähigkeit eines Modells anhand der Rechenleistung gemessen werden. Wir verwenden SenseCore, ein großes Gerät von SenseTime, um die Infrastruktur der AGI-Ära aufzubauen. Wir aktualisieren ständig die Iterationsgeschwindigkeit des Modells.“ und Problemlösungsfähigkeiten. Erschließen Sie mehr Möglichkeiten mit AGI.“
Berichten zufolge hat SenseTime seit Mai dieses Jahres mehr als 40 Kernkunden bedient, darunter mehr als 10 große Modellkunden, und deckt Spitzenbereiche wie intelligentes Fahren, Biopharmazeutika, Chipdesign, Smart Business und universitäre wissenschaftliche Forschung ab und hat in mehr als 20 Landungsszenarien eine große Modellauslieferung erreicht.
Yang Fan, Mitbegründer von SenseTime und Präsident der Large Device Business Group, sagte, dass die Leistungsentwicklung großer Modelle, die wir heute beobachten, die Verbesserung des technischen Werts sei, die durch die kontinuierliche Vergrößerung des Umfangs der drei Elemente der künstlichen Intelligenz herbeigeführt werde , und es ist auch die Grundlage dafür. Die perfekte Kombination aus F&E-Fähigkeiten und systematischen Engineering-Fähigkeiten. Diese drei Elemente sind oft gemeinsam abgestimmt: Algorithmenoptimierung, Datensortierung und -auswahl sowie Rechenleistungsplattform. Es ist schwierig, sie in separate Links umzuwandeln und dies allein zu tun. Aus diesem Grund müssen wir eine intelligente Industriekette für Rechenleistung aufbauen, denn nur wenn mehr Unternehmen in der Kette den Austausch, die Zusammenarbeit, das Denken und eine tiefergehende Zusammenarbeit fördern, können wir in der neuen kritischen Welle wichtiger technologischer Fortschritte besser abschneiden und Unterstützung.
Das obige ist der detaillierte Inhalt vonDie Nachfrage nach Rechenleistung ist im Zuge der Welle großer KI-Modelle explodiert. „Großes Modell + große Rechenleistung' von SenseTime ermöglicht die Entwicklung mehrerer Branchen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!