Maison  >  Article  >  Tutoriel matériel  >  Stardust Data lance MorningStar, son premier produit axé sur la découverte de la valeur des données

Stardust Data lance MorningStar, son premier produit axé sur la découverte de la valeur des données

王林
王林avant
2024-03-21 13:12:19599parcourir

Le 11 mars, Stardust AI, l'une des principales sociétés internationales de technologie de données sur l'IA, a tenu sa conférence de lancement de produit du printemps 2024 à Pékin et a lancé MorningStar, un produit de données en boucle fermée pour l'IA. MorningStar est la première plateforme de données d'IA axée sur la découverte de la valeur des données. Par rapport aux outils de gestion de données traditionnels, cette plateforme de découverte, de gestion, de collaboration et d'itération de données d'IA avec des concepts avancés, une utilisation simple et des fonctions riches est conçue pour accélérer la découverte de la valeur des données. itération du modèle et résoudre le problème de la dette des données d'IA. La création peut prendre en charge le lien clé d'une itération efficace des données d'IA d'entreprise et éviter des problèmes tels que l'accumulation de risques de dette de données, le gaspillage de coûts de données de faible valeur et la longue chaîne de rétroaction du modèle. effets de formation et d’application.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲ MorningStar est officiellement publié

Actuellement, la plateforme de gestion de données MorningStar est ouverte aux candidatures. Vous pouvez accéder au site officiel pour voir plus de présentations et soumettre les exigences.

1. Qu'est-ce que MorningStar ?

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲ MorningStar Data Closed Loop

MorningStar est un outil tout-en-un qui répond aux besoins de gestion des données de l'ère AI2.0. Il est conçu pour améliorer l'efficacité de la gestion des données non structurées pour les ingénieurs en algorithmes et économiser. les coûts de gestion des actifs de données et le temps d'itération des lancements de modèles, avec une gestion du cycle de vie des données de pointe, des outils d'exploration de données complets, de puissants indicateurs de suivi et des capacités de découverte de cas difficiles, une gestion efficace et conforme des actifs de données et d'autres avantages produits, dépassent de loin les produits similaires à domicile. et à l'étranger, rendant le développement d'algorithmes plus fluide, plus agile, permettant de libérer pleinement la valeur des données.

2. Qui sont les utilisateurs de MorningStar ?

En créant un environnement collaboratif centré sur les données, MorningStar peut éliminer le problème de la dette des données d'IA d'entreprise et sert principalement trois types d'utilisateurs : les ingénieurs en algorithmes d'apprentissage automatique, le personnel commercial et les responsables techniques. Pour différents utilisateurs, MorningStar peut répondre à divers besoins, couvrant des scénarios d'utilisation riches tels que la découverte de cas difficiles de données, l'itération de modèles, le suivi d'indicateurs, l'exploration de la valeur des données, le retour d'information sur les effets commerciaux, les tests opérationnels et la précipitation de la valeur d'entreprise.

3. Pourquoi choisir MorningStar ?

La technologie des données a favorisé trois changements dans l'intelligence artificielle. À l'ère des grands modèles, tous les horizons doivent créer des super employés basés sur leurs propres données pour améliorer l'efficacité de la production de l'entreprise. Les modèles et la puissance de calcul peuvent être achetés, mais les données nécessitent une gestion raffinée et complète des processus pour libérer une valeur réelle. Les entreprises doivent créer un pipeline de données détectable, gérable, collaboratif et itérable pour avoir la capacité d'obtenir des données, de produire des données et de les itérer en continu, et de promouvoir une collaboration interne centrée sur les données pour obtenir des données à l'ère de l'IA 2.0. compétitivité.

MorningStar est le seul produit de données en boucle fermée sur le marché spécialement conçu pour les entreprises à l'ère de l'IA 2.0. Il couvre de manière exhaustive les liens en boucle fermée tels que la gestion des données, l'itération, l'optimisation et l'exploration des algorithmes d'IA, de la formation à la formation. production, et s'engage à aider les entreprises à établir des systèmes de données efficaces en boucle fermée pour maximiser la valeur des données et optimiser les effets de modèle, contribuant ainsi à créer des barrières de compétitivité différenciées.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲ Avantages du produit MorningStar

(1) Gestion du cycle de vie des données de pointe

Les ingénieurs algorithmiques peuvent gérer le cycle de vie des données de l'IA via MorningStar, renforcer le contrôle des versions des données, le découpage rapide des données, ainsi que le traçage des données et le contrôle de sécurité. . Le flux de travail automatisé de la plateforme garantit que les données sont correctement gérées et optimisées à chaque étape.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Découpage des données

Fonction de découpage des données flexible, les ingénieurs en algorithmes peuvent sélectionner la direction des données d'itération de l'algorithme en un seul clic pour les processus de traitement des données ultérieurs.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Flux de données : enregistrez le processus de production de versions de données contenant différentes informations sémantiques

Orchestration et planification des processus de données. Les ingénieurs en algorithmes peuvent facilement enregistrer le processus de traitement des données et les résultats sémantiques, effectuer la gestion des versions et enregistrer la vie complète. cycler les informations sur les données, garantissant la traçabilité des données et la reproductibilité des opérations.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Flux de données : source de données et soumission des données

Les ingénieurs algorithmiques peuvent comparer la vraie valeur du modèle via la plate-forme, trouver des données difficiles grâce à une série d'outils de traçage de données, de débogage de modèle et de génération d'analyse, et les soumettre en un clic au système d'annotation des données Rosetta.

(2) Outils complets d'exploration de données

MorningStar prend en charge l'exploration approfondie de la valeur des données, y compris la visualisation fine, le calcul d'indicateurs, l'exploration de la distribution des données, la récupération de données multimodales, etc. Il peut obtenir la meilleure valeur à moindre coût grâce à la supervision manuelle, à la récupération sémantique, aux fonctionnalités La génération et l'amélioration des données. Des algorithmes optimaux et grâce à une logique d'exploration de données visuelle, aident les utilisateurs à découvrir et à résoudre les problèmes liés à la formation de modèles.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Visualisation de la distribution

L'image ci-dessus montre que MorningStar utilise une logique d'exploration de données visuelle pour trouver des données de cas difficiles et des données avec une distribution d'étiquettes anormale, et a une riche évolutivité.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Exploration des données

Les ingénieurs en algorithmes peuvent utiliser MorningStar pour effectuer la récupération de données dans divers scénarios et dimensions, saisir rapidement la situation des données et formuler des idées d'expériences algorithmiques.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

MorningStar prend en charge divers types de visualisation de données multimodales et de récupération sémantique, ce qui facilite et accélère l'exploration directionnelle des données de grande valeur requises.

(3) Puissantes capacités de suivi d'indicateurs et de découverte de cas difficiles

En tant que premier produit de données en boucle fermée intégrant des stratégies de découverte de cas difficiles, MorningStar peut garantir que le processus de formation du modèle est traçable et itérable. Grâce à une série d'outils de traçage de données, de débogage de modèles et de génération d'analyses, il permet de réaliser et de maintenir des modèles Al de haute qualité et reproductibles.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Traçabilité des données : grâce au flux de données, les données utilisées pour l'évaluation des algorithmes peuvent être tracées à tout moment.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Comparaison des versions

En sélectionnant différentes versions de données, vous pouvez comparer les résultats de prédiction de l'algorithme avec les valeurs réelles et les combiner avec la fonction de visualisation pour localiser et analyser facilement les données de cas difficiles.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Suivi des indicateurs et détection des effets

MorningStar connecte facilement l'environnement de formation des modèles, la gestion de l'analyse des données de formation et l'environnement d'analyse des indicateurs via le SDK, et effectue facilement des itérations d'algorithme.

(4) Gestion efficace et conforme des actifs de données

MorningStar prend en charge une analyse complète des ensembles de données, aide les chefs d'entreprise à mettre en œuvre une analyse de gestion des éléments de données au niveau de l'entreprise et présente en un coup d'œil l'échelle des actifs de données, la distribution du contenu et la propriété. Informations sur les actifs équidimensionnels.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Audit de conformité des données

Les équipes peuvent intégrer des actifs de données et partager la valeur d'usage via MorningStar. Grâce à la gestion des autorités et aux enregistrements d'utilisation, la circulation des données entre les services est accélérée tout en garantissant la sécurité des données.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

▲Affichage des actifs de données

De plus, MorningStar intègre des données multi-sources, multi-formats et hétérogènes, gère des données de très grande capacité et réalise une modélisation visuelle des actifs de l'entreprise, il prend en charge la classification et l'inventaire de plusieurs ; Des données à granularité fine et multidimensionnelles pour promouvoir l'entreprise Une compréhension approfondie des données internes améliore l'efficacité du flux de données dans la collaboration entre départements.

 星尘数据推出首款专注数据价值发现的产品 MorningStar

La figure ci-dessus montre le classement de la valeur de popularité des ensembles de données via MorningStar et évalue la valeur des actifs de données pour l'itération de l'algorithme à travers les temps d'utilisation des données, les étiquettes de scène, les résultats d'annotation, etc., pour faciliter l'analyse des avantages économiques de éléments de données.

(5) Plus de fonctions

En tant qu'excellent ingénieur en algorithmes, utilisez-vous toujours des outils originaux que vous avez créés vous-même, des outils temporaires ou même Excel pour traiter les données ? En tant que plateforme professionnelle de découverte, de gestion, de collaboration et d'itération de données d'IA, MorningStar vous permet non seulement d'effectuer les opérations avancées ci-dessus, mais dispose également d'une multitude de fonctions pratiques ! Par exemple, il prend en charge la gestion unifiée des données structurées multi-sources, multi-formats et hétérogènes ; prend en charge le SDK, peut effectuer l'évaluation et la surveillance des performances du modèle et obtenir un rapport d'évaluation complet du modèle.

Il est à noter que l'évaluation automatisée CIF-Bench créée par Stardust Data et l'Université des sciences et technologies de Hong Kong sera bientôt lancée sur MorningStar ! Les 28 listes d'évaluation de modèles se concentrent sur l'évaluation de 20 dimensions de base et sur l'examen de la capacité du modèle à suivre des instructions sur 150 types de tâches. Lien vers la liste : https://yizhillll.github.io/CIF-Bench/.

Un ingénieur en algorithme de conduite autonome a signalé un jour que les cas difficiles qui prenaient initialement une journée à découvrir ne pouvaient être trouvés via la plate-forme qu'en 1 à 2 heures, améliorant considérablement l'efficacité des itérations.

À l'avenir, MorningStar continuera à effectuer des mises à jour itératives. Les utilisateurs sont invités à nous faire part de précieuses suggestions et à travailler avec nous pour reconstruire la gestion en boucle fermée des données afin de rendre les itérations des algorithmes d'IA plus efficaces !

5. MorningStar est officiellement publié

Selon le fondateur et PDG de Stardust Data, Zhang Lei : « À l'ère de l'IA 2.0, maîtriser vos propres données signifie maîtriser votre propre modèle. gérer et itérer les données. Dans la vague en constante évolution de la technologie de l’IA, la gestion continue, l’optimisation et l’itération des données deviendront un facteur clé permettant aux entreprises de se démarquer à l’ère de l’IA 2.0. Si votre entreprise espère utiliser ses propres données et des dizaines de milliards de modèles à grande échelle pour créer ses propres super employés, MorningStar vous invite sincèrement à communiquer avec nous. Quel que soit le type d'utilisateur ayant des besoins en matière de gestion des données d'IA, MorningStar peut fournir des solutions complètes et des méthodes d'utilisation flexibles, notamment le SaaS, le déploiement de privatisation d'entreprise et la prise en charge du développement de logiciels personnalisés.

Adresse officielle du site Web du produit : https://stardust.ai/MorningStar

Adresse de soumission des exigences : https://stardust.ai/contact

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer