Cet article est une traduction de la "Liste des meilleurs logiciels Open Source" publiée par InfoWorld en 2021année. InfoWorld est une société de médias informatiques fondée en 1978 et qui fait actuellement partie d'IDG. Chaque année, InfoWorld sélectionne le « Meilleur logiciel Open Source » (BOSSIE) de l'année en fonction de la contribution du logiciel à la communauté open source et de son influence dans l'industrie. Cette sélection de prix dure depuis plus de dix ans.Les 29 projets open source qui ont remporté ce prix comprennent : Développement de logiciels, développement, cloud natif, apprentissage automatique et autres types, jetons un coup d'œil ci-dessous, y a-t-il des visages familiers ? ! 1, Svelte et SvelteKit
Parmi les nombreux frameworks JavaScript front-end innovants, open source, Svelte et son homologue full-stack SvelteKit sont peut-être les plus ambitieux et les plus visionnaires. Svelte a bouleversé le statu quo en adoptant dès le début des stratégies de compilation et a progressé avec d'excellentes performances, un développement continu et une excellente expérience de développement.Désormais en version bêta publique, SvelteKit perpétue la tradition Svelte consistant à franchir le pas en adoptant les derniers outils et en faisant du déploiement dans des environnements sans serveur une fonctionnalité intégrée. Adresse : https://github.com/sveltejs/svelte
2, Minikube
Minikube est un outil simple pour exécuter Kubernetes localement ou créer facilement un stand. cluster Kubernetes seul au sein d’une machine virtuelle sur votre ordinateur portable. Il est facile d'essayer Kubernetes ou d'utiliser Kubernetes pour le développement quotidien.Adresse : https://github.com/kubernetes/minikube
3, Pixie
Pixie est un outil d'observabilité pour les applications Kubernetes, qui peut afficher un cluster de haut niveau État des performances, comme les cartes de service, les ressources du cluster et le trafic des applications ; vous pouvez également accéder à des vues plus détaillées, telles que l'état des pods, les graphiques de flamme et les demandes d'applications individuelles complètes. Pixie collecte automatiquement les données de télémétrie à l'aide d'eBPF, qui collecte, stocke et interroge toutes les données de télémétrie localement sur le cluster, en utilisant moins de 5 % du processeur du cluster. Les cas d'utilisation de Pixie incluent la surveillance du réseau au sein du cluster, la santé de l'infrastructure, les performances des services et le profilage des requêtes de base de données. Adresse : https://github.com/pixie-io/pixie
4. FastAPI
FastAPI est un framework Web haute performance pour la création d'API. Caractéristiques principales :
Rapide : très hautes performances, à égalité avec NodeJS et Go
Codage rapide : augmente la vitesse de développement des fonctionnalités d'environ 200 % à 300 %
Moins d'erreurs : Environ 40 % d'erreurs humaines en moins
Intuitif : prise en charge puissante de l'éditeur, saisie semi-automatique partout, moins de temps de débogage
Facile : conçu pour être facile à utiliser et à apprendre, réduit le temps de lecture du document.
Court : Réduisez la duplication de code.
Robuste : obtenez du code prêt pour la production, avec une documentation interactive automatique
Basé sur standard : basé sur et entièrement compatible avec les standards ouverts de l'API OpenAPI et JSON Schema
Adresse : https://github.com/tiangolo/fastapi
5, Crystal
Crystal est en développement depuis plusieurs années en tant que projet visant à fournir un langage de programmation avec la vitesse du C et l'expressivité de Ruby. Avec la sortie de Crystal 1.0 plus tôt cette année, le langage est désormais suffisamment stable pour être utilisé pour des charges de travail générales. Crystal utilise le typage statique et le compilateur LLVM pour atteindre une vitesse élevée et éviter les problèmes courants tels que les références nulles au moment de l'exécution. Crystal peut s'interfacer avec le code C existant pour augmenter encore la vitesse et la commodité, et il peut également utiliser des macros de compilation pour étendre la syntaxe du langage de base. Adresse : https://github.com/cristal-lang/cristal
6. Windows Terminal
Windows Terminal est un tout nouvel outil de terminal de ligne de commande populaire et puissant. Il contient de nombreuses fonctionnalités très demandées par la communauté, telles que : la prise en charge de plusieurs onglets, le texte enrichi, la prise en charge de plusieurs langues, les thèmes et styles configurables, la prise en charge du rendu de texte basé sur les emoji et le GPU, etc. Dans le même temps, le terminal répond toujours à nos objectifs et exigences pour garantir qu'il reste rapide, efficace et ne consomme pas de grandes quantités de mémoire et d'énergie. Suivez la communauté chinoise LinuxAdresse : https://github.com/Microsoft/Terminal
7, OBS Studio
OBS Studio est un logiciel de diffusion en direct et d'enregistrement d'écran, conçu pour une capture, une synthèse, un encodage, un enregistrement et une diffusion en continu efficaces de contenu vidéo, prenant en charge toutes les plateformes multimédias de streaming.
- Capture et mixage vidéo/audio en temps réel hautes performances. Créez des scènes composées de plusieurs sources, notamment des captures de fenêtres, des images, du texte, des fenêtres de navigateur, des webcams, des cartes de capture, etc.
- Définissez un nombre illimité de scènes que les utilisateurs peuvent changer de manière transparente avec des transitions personnalisées.
- Mélangeur audio intuitif avec filtres pour chaque source, tels que noise gate, suppression de bruit et gain. Contrôle total sur la prise en charge des plug-ins VST.
- Options de configuration puissantes et faciles à utiliser. Ajoutez de nouvelles sources, copiez des sources existantes et ajustez facilement leurs propriétés.
- Un panneau de paramètres simplifié permet aux utilisateurs d'accéder à une variété d'options de configuration pour ajuster chaque aspect de la diffusion ou de l'enregistrement.
- L'interface utilisateur modulaire « Dock » permet aux utilisateurs de réorganiser la mise en page exactement selon leurs besoins. Les utilisateurs peuvent même afficher chaque Dock individuel dans sa propre fenêtre.
Adresse : https://github.com/obsproject/obs-studio
8, Shotcut
Shotcut est un outil de montage vidéo multiplateforme qui permet d'apporter toutes les corrections standard aux pistes audio et vidéo tout en appliquant des effets et des superpositions. Shotcut a une communauté très active et propose des tonnes de vidéos pratiques et de didacticiels pour aider les vidéastes débutants et avancés. Il fonctionne sur Mac, Linux, BSD et Windows – et bien qu'il soit multiplateforme, son interface est rapide et relativement simple à utiliser par rapport à des outils similaires. Adresse : https://github.com/mltframework/shotcut
9, Weave GitOps Core
Weave GitOps prend en charge des workflows GitOps efficaces pour la livraison continue d'applications dans des clusters Kubernetes. Il est basé sur le moteur GitOps leader CNCF Flux. Adresse : https://github.com/weaveworks/weave-gitops
10, Apache Solr
Apache Solr est un serveur de recherche en texte intégral basé sur Lucene et le moteur de recherche au niveau de l'entreprise le plus populaire. Apache Lucene est la technologie de recherche sous-jacente aux capacités de recherche de la plupart des logiciels que vous utilisez, y compris d'autres moteurs de recherche comme Elasticsearch. Contrairement à Elasticsearch, Solr a renoncé à sa licence open source, même si celle-ci reste gratuite. Solr est clusterisable, déployable dans le cloud et suffisamment puissant pour créer des services de recherche à l'échelle du cloud. Il comprend même un algorithme LTR pour aider à ajuster et pondérer automatiquement les résultats. Adresse : https://github.com/apache/solr
11, MLflow
MLflow a été créé par Databricks et hébergé par la Linux Foundation. Il s'agit d'une plate-forme MLOps qui permet aux utilisateurs de suivre, de gérer et de maintenir divers modèles d'apprentissage automatique, leurs expériences et leurs. déployer. Il vous fournit des outils pour enregistrer et interroger des expériences (code, données, configurations, résultats), regrouper le code de science des données dans des projets et lier ces projets dans des flux de travail. Adresse : https://github.com/mlflow/mlflow
12, Orange
Orange a pour objectif de rendre le data mining "productif et ludique". Orange permet aux utilisateurs de créer un flux de travail d'analyse de données qui exécute diverses fonctions d'apprentissage automatique et d'analyse ainsi que des visualisations. Comparé aux outils programmatiques ou textuels comme R Studio et Jupyter, Orange est très intuitif. Vous pouvez faire glisser des widgets sur le canevas pour charger des fichiers, analyser les données avec des modèles et visualiser les résultats. Adresse : https://github.com/biolab/orange3
13, Flutter
Flutter est conçu par l'équipe d'ingénieurs de Google pour créer des applications mobiles multiplateformes hautes performances. Flutter est optimisé pour les appareils mobiles actuels et futurs, en se concentrant sur une entrée à faible latence et des fréquences d'images élevées pour Android et iOS. Il peut fournir aux développeurs un moyen simple et efficace de créer et de déployer des applications mobiles multiplateformes et hautes performances ; offre aux utilisateurs une expérience d'application magnifique, rapide et sans instabilité ; Adresse : https://github.com/flutter
14, Apache Superset
Apache Superset est une plateforme open source d'exploration et de visualisation de données Airbnb (une société de location de maisons à court terme en ligne bien connue) (anciennement connue sous le nom de Panoramix, Caravel), cet outil est utilisé en visualisation. Il se distingue par sa facilité d'utilisation et son interactivité, et les utilisateurs peuvent facilement effectuer une analyse visuelle des données. Apache Superset est également une application Web de business intelligence de niveau entreprise. Adresse : https://github.com/apache/superset
15, Presto
Presto est un moteur SQL distribué open source pour le traitement analytique en ligne, exécuté dans un cluster. Presto peut interroger une grande variété de sources de données, des fichiers aux bases de données, et renvoyer les résultats à de nombreux environnements de business intelligence et d'analyse. De plus, Presto permet d'interroger des données où qu'elles se trouvent, y compris Hive, Cassandra, les bases de données relationnelles et les magasins de données propriétaires. Une requête Presto peut combiner des données provenant de plusieurs sources. Facebook utilise Presto pour effectuer des requêtes interactives sur plusieurs magasins de données internes, y compris leur entrepôt de données de 300 Po . Adresse : https://github.com/prestodb/presto
16, Apache Arrow
Apache Arrow définit un format de mémoire en colonnes indépendant du langage pour les données plates et hiérarchiques, organisé pour des opérations d'analyse efficaces sur les CPU et GPU modernes. Le format de mémoire Arrow prend également en charge les lectures sans copie pour un accès ultra-rapide aux données sans surcharge de sérialisation. Les bibliothèques Arrow sont disponibles pour C, C++, C#, Go, Java, JavaScript, Julia, MATLAB, Python, R, Ruby et Rust.
Adresse : https://github.com/apache/arrow
17, InterpretML
InterpretML ist ein Open-Source-Paket für erklärbare KI (XAI), das mehrere hochmoderne Interpretierbarkeitstechnologien für maschinelles Lernen enthält. Mit InterpretML können Sie interpretierbare „Glasbox“-Modelle trainieren und Black-Box-Systeme interpretieren. InterpretML kann Ihnen helfen, das globale Verhalten Ihres Modells zu verstehen oder die Gründe für einzelne Vorhersagen zu verstehen. Zu den zahlreichen Funktionen von InterpretML gehört ein „Glass-Box“-Modell von Microsoft Research namens „Explainable Boosting Machine“, das Lime für die Post-hoc-Interpretation mit einer Annäherung an das Black-Box-Modell unterstützt. Adresse: https://github.com/interpretml/interpret18, Lime Ergebnisse maschineller Vorhersage. Lime ist in der Lage, jeden Black-Box-Klassifikator mit zwei oder mehr Klassen zu interpretieren, was
sowohl für Text- als auch für Bilddomänen gilt. Lime ist auch in InterpretML enthalten.
Adresse: https://github.com/marcotcr/lime19, Dask
Dask ist eine Open-Source-Bibliothek für paralleles Rechnen, die Python-Pakete auf mehrere Maschinen erweitern kann. Dask kann Daten und Berechnungen auf mehrere GPUs verteilen, entweder innerhalb desselben Systems oder in einem Cluster mit mehreren Knoten. Dask lässt sich mit Rapids cuDF, XGBoost und Rapids cuML für GPU-beschleunigte Datenanalyse und maschinelles Lernen integrieren. Es lässt sich auch in NumPy, Pandas und Scikit-learn integrieren, um seinen Workflow zu parallelisieren
Adresse: https://github.com/dask/dask
20, BlazingSQL
BlazingSQL ist eine GPU-beschleunigte SQL-Engine, die auf dem RAPIDS-Ökosystem basiert. RAPIDS basiert auf dem spaltenorientierten Speicherformat „Apache Arrow“; cuDF ist eine GPU-DataFrame-Bibliothek zum Laden, Zusammenführen, Aggregieren, Filtern und Bearbeiten von Daten. Es ist die SQL-Schnittstelle zu cuDF mit verschiedenen Funktionen zur Unterstützung umfangreicher Data-Science-Workflows und Unternehmensdatensätze. Adresse: https://github.com/BlazingDB/blazingsql21, Rapids
Nvidias Rapids-Suite aus Open-Source-Softwarebibliotheken und APIs gibt Ihnen die Möglichkeit, End-to-End-Datenwissenschafts- und Analysepipelines vollständig auf GPUs auszuführen. Rapids verwendet Nvidia CUDA-Grundelemente für Rechenoptimierungen auf niedriger Ebene und stellt die Parallelität und Speichergeschwindigkeiten von GPUs mit hoher Bandbreite über eine benutzerfreundliche Python-Schnittstelle zur Verfügung. Rapids basiert auf dem spaltenorientierten Speicherformat Apache Arrow, einschließlich cuDF, einer Pandas-ähnlichen DataFrame-Bibliothek; cuML, einer Sammlung von Bibliotheken für maschinelles Lernen, die GPU-Versionen der meisten Algorithmen in Scikit-learn bereitstellen; und cuGraph, eine beschleunigte Graphanalysebibliothek ähnlich wie NetworkX
Adresse: https://github.com/rapidsai/cudf
22, PostHog
PostHog ist eine Open-Source-Produktanalyseplattform für Entwickler. Erfassen Sie automatisch jedes Ereignis auf Ihrer Website oder App, ohne Daten an Dritte zu senden. Es bietet ereignisbasierte Analysen auf Benutzerebene und erfasst Nutzungsdaten für Ihr Produkt, um zu sehen, welche Benutzer welche Aktionen in Ihrer Anwendung ausgeführt haben. Es erfasst automatisch Klicks und Seitenaufrufe, um zu analysieren, was Ihre Benutzer tun, ohne dass Ereignisse manuell übertragen werden müssen. Adresse: https://github.com/PostHog/posthog
23, LakeFS
LakeFS bietet eine Möglichkeit, „Ihren Data Lake auf die gleiche Weise zu verwalten, wie Sie Code verwalten“, und fügt dem Objektspeicher eine Ebene der Git-ähnlichen Versionskontrolle hinzu. Diese Anwendung der Git-Semantik ermöglicht es Benutzern, ihre eigenen isolierten, kopierfreien Datenzweige zu erstellen, an denen sie arbeiten, experimentieren und Modellanalysen durchführen können, ohne dass das Risiko besteht, gemeinsam genutzte Objekte zu beschädigen. LakeFS bietet nützliche Festschreibungshinweise, Metadatenfelder und Rollback-Optionen für Ihre Daten sowie Validierungs-Hooks, um die Datenintegrität und -qualität aufrechtzuerhalten – bevor ein nicht festgeschriebener Zweig versehentlich wieder in die Produktion eingebunden wird, führen Sie Format- und Schemaprüfungen durch. Mit LakeFS können bekannte Techniken zur Verwaltung und Sicherung von Codebasen auf moderne Datenbanken wie Amazon S3 und Azure Blob Storage ausgeweitet werden. Adresse: https://github.com/treeverse/lakeFS
24.09.2020, Meltano Das Data Warehousing-Framework von Meltano erleichtert das Modellieren, Extrahieren und Transformieren von Daten für Ihre Projekte und ergänzt Integrations- und Transformationspipelines durch integrierte Analysetools und Dashboards, die die Berichterstellung vereinfachen. Meltano bietet eine zuverlässige Extraktor- und Loader-Bibliothek sowie Unterstützung für Singers standardmäßige Datenextraktions-Taps und Datenladeziele und ist bereits ein Kraftpaket für die Datenorchestrierung.
25, Trino
Trino (früher bekannt als PrestoSQL) ist eine verteilte SQL-Analyse-Engine, die extrem schnelle Abfragen für große verteilte Datenquellen ausführen kann. Mit Trino können Sie Abfragen für einen Data Lake, einen relationalen Speicher oder mehrere unterschiedliche Quellen gleichzeitig ausführen, ohne Daten zur Verarbeitung kopieren oder verschieben zu müssen.Und Trino funktioniert gut mit allen Business-Intelligence- und Analysetools, die Ihre Datenwissenschaftler verwenden, egal ob interaktiv oder Ad-hoc, wodurch die Lernkurve minimiert wird. Da Dateningenieure bestrebt sind, komplexe Analysen über eine zunehmende Anzahl von Datenquellen hinweg zu unterstützen, bietet Trino eine Möglichkeit, die Abfrageausführung zu optimieren und Ergebnisse aus unterschiedlichen Quellen zu beschleunigen.
Address: https://github.com/trinodb/trino
26, Streamnative
Streamnative ist eine hochskalierbare Botschafts- und Ereignis -Streaming -Plattform, die die Real erheblich vereinfacht, -Time Reporting- und Analysetools und Datenpipelines für Unternehmensanwendungsflüsse. StreamNative kombiniert die leistungsstarke verteilte Stream-Verarbeitungsarchitektur von Apache Pulsar mit Enterprise-Extras wie Kubernetes- und Hybrid-Cloud-Unterstützung, einer großen Bibliothek von Datenkonnektoren, einfacher Authentifizierung und Autorisierung sowie speziellen Tools für die Gesundheits- und Leistungsüberwachung, um die Pulsar-basierte Entwicklung zu vereinfachen -Zeitanwendungen und vereinfacht die Bereitstellung und Verwaltung großer Messaging-Backplanes. Adresse: https://github.com/streamnative
27, Hugging Face
Hugging Face bietet die wichtigste Open-Source-Deep-Learning-Ressourcenbibliothek, die an sich kein Deep-Learning-Framework ist. Das Ziel von Hugging Face besteht darin, über den Text hinauszugehen und Bilder, Audio, Video, Objekterkennung usw. zu unterstützen. Infoworld weist darauf hin, dass Deep-Learning-Praktiker diesem Repo in den kommenden Jahren große Aufmerksamkeit schenken sollten. Adresse: https://github.com/huggingface/transformers
28, EleutherAI
EleutherAI ist eine verteilte Gruppe von Forschern für maschinelles Lernen mit dem Ziel, GPT-3 jedem zugänglich zu machen. Anfang 2021 veröffentlichte EleutherAI The Pile, einen 825 GB großen, vielfältigen Textdatensatz für das Training, und kündigte im Juni GPT-J an, ein 6-Milliarden-Parameter-Modell, das in etwa der GPT-3-Curie-Variante von OpenAI entspricht. Mit der Einführung von GPT-NeoX plant EleutherAI, die Parameter auf bis zu 175 Milliarden zu erhöhen, um mit dem derzeit am weitesten verbreiteten GPT-3-Modell zu konkurrieren. Adresse: https://github.com/EleutherAI/gpt-neo
29, Colab-Notizbücher für generative Kunst
An erster Stelle steht das CLIP-Modell (Contrastive Language-Image Pre-trained) von OpenAI, ein multimodales Modell zum Generieren von Text- und Bildvektoreinbettungen. Während CLIP vollständig Open Source ist, ist dies beim generativen neuronalen Netzwerk DALL-E von OpenAI nicht der Fall. Um diese Lücke zu schließen, haben Ryan Murdoch und Katherine Crowson Colab-Notizbücher entwickelt, die CLIP mit anderen Open-Source-Modellen wie BigGAN und VQGAN kombinieren, um aufforderungsbasierte generative Kunst zu produzieren. Diese unter der MIT-Lizenz lizenzierten Notizbücher wurden in den letzten Jahrzehnten im Internet weit verbreitet, neu abgemischt, verändert, übersetzt und zur Schaffung atemberaubender Kunstwerke verwendet.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!