Heim >Technologie-Peripheriegeräte >KI >Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

PHPz
PHPznach vorne
2024-03-26 20:20:281108Durchsuche

Textanmerkungsarbeit ist die Arbeit entsprechender Beschriftungen oder Markierungen für bestimmte Inhalte im Text. Sein Hauptzweck besteht darin, zusätzliche Informationen zum Text für eine tiefere Analyse und Verarbeitung bereitzustellen, insbesondere im Bereich der künstlichen Intelligenz.

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Textanmerkungen sind für überwachte maschinelle Lernaufgaben in Anwendungen der künstlichen Intelligenz von entscheidender Bedeutung. Es wird zum Trainieren von KI-Modellen verwendet, um Textinformationen in natürlicher Sprache genauer zu verstehen und die Leistung von Aufgaben wie Textklassifizierung, Stimmungsanalyse und Sprachübersetzung zu verbessern. Durch Textanmerkungen können wir KI-Modellen beibringen, Entitäten im Text zu erkennen, den Kontext zu verstehen und genaue Vorhersagen zu treffen, wenn neue ähnliche Daten auftauchen.

In diesem Artikel werden hauptsächlich einige bessere Open-Source-Textanmerkungstools empfohlen.

1.Label Studio

https://github.com/HumanSignal/label-studio

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Label Studio ist ein Open-Source-Datenanmerkungstool, das mehrere Datentypen verarbeiten kann und den Export in mehrere Modellformate unterstützt. Es wird häufig zur Vorbereitung von Rohdaten oder zur Verbesserung bestehender Trainingsdaten verwendet, um die Genauigkeit von Modellen für maschinelles Lernen zu verbessern.

2.Doccano

https://github.com/doccano/doccano

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Doccano ist ein Open-Source-Textanmerkungstool, das Funktionen zur Textklassifizierung, Sequenzkennzeichnung und Sequenzaufgaben bereitstellt. Es unterstützt die Teamzusammenarbeit bei Textanmerkungen, mehrsprachige, mobile Apps, Emojis, dunkle Themen und APIs im REST-Stil. Kann mit Docker und Docker Compose installiert werden.

3.Universal Data Tool

https://github.com/UniversalDataTool/universal-data-tool

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Universal Data Tool ist ein Tool zum Bearbeiten und Kommentieren verschiedener Datentypen (einschließlich Bilder, Text, Audio und Dokumente). Es unterstützt eine Vielzahl von Datentypen und bietet Echtzeit-Zusammenarbeit, eine benutzerfreundliche GUI, die Erstellung von Schulungskursen für Textkommentatoren und mehr. Das Tool ist im Web oder als Desktop-Anwendung verfügbar und unterstützt das Herunterladen und Hochladen von Daten im CSV- oder JSON-Format.

4.YEDDA

https://github.com/jiesutd/YEDDA

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

YEDDA ist ein Textanmerkungstool, das in verschiedenen Sprachen, Symbolen und Emoticons verwendet werden kann. Es unterstützt die Verwendung von Verknüpfungen, die Steuerung des Modells und den Export von Anmerkungstext als Sequenztext. Unterstützt Funktionen wie intelligente Empfehlungen und Administratoranalyse.

YEDDA ist mit allen gängigen Betriebssystemen kompatibel, einschließlich Windows, Linux und MacOS. 5. Argilla

Es hilft bei der Kontrolle der Datenqualität und der Verbesserung der KI-Ausgabequalität und verbessert die Effizienz, indem es eine schnelle Iteration von Daten und Modellen ermöglicht. Argilla bietet auch Datenverwaltungs- und Modelltrainingstools.
6.KernAI Refinery

https://github.com/code-kern-ai/refinery

Refinery ist eine Open-Source-Plattform von KernAI, die für Datenwissenschaftler entwickelt wurde, die Daten in natürlicher Sprache verarbeiten. Es bietet Funktionen wie halbautomatische Datenanmerkung, Qualitätsbewertung von Datenteilmengen und zentralisierte Datenüberwachung mit dem Ziel, die Effizienz der manuellen Kennzeichnung zu verbessern.
Das Tool nutzt Technologien wie Hugging Face und spaCy, um vorgefertigte Sprachmodelle zu erstellen und lässt sich für eine flexible Datenverarbeitung in andere Beschriftungstools integrieren.

Eigenschaften:

  • (Halb-)automatisierter Kennzeichnungsworkflow für NLP-Aufgaben
  • Manuelle und programmatische Klassifizierung und Span-Kennzeichnung
  • Unterstützt die Integration mit modernsten Bibliotheken und Frameworks
  • Nachschlagetabellen/Wissensdatenbanken erstellen und verwalten
  • Neuronale Suche -basierter Ähnlichkeitsdatensatz und Ausreißerabruf
  • Slicable Tagging-Sitzungen
  • Mehrere Tagging-Aufgaben pro Projekt
  • Umfangreiche Automatisierungsbibliothek
  • Umfangreiche Datenverwaltung und -überwachung
  • Integriert in Hugging Face für die automatische Erstellung von Einbettungen
  • Basierend auf dem Datenmodell von JSON zum Hoch-/Herunterladen von Daten
  • Übersicht über Projektmetriken
  • Zugriff auf und Erweiterung von Daten über Python SDK
  • Änderung von Eigenschaften vor Ort
  • Zusammenarbeit im Team in der gehosteten Version
  • Rollenbasierter Zugriff für mehrere Benutzer und minimierte Tag-Ansicht
  • Integrierte Gruppe Tagging-Workflow
  • Berechnet automatisch den Konsens zwischen Annotatoren

7.Recogito.js

https://github.com/recogito/recogito-js

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

ApplitoJS ist eine JavaScript-Bibliothek für Textanmerkungen, die verwendet wird um Textanmerkungsfunktionen zu Webseiten hinzuzufügen oder benutzerdefinierte Textanmerkungsprogramme zu erstellen. Es kann über npm oder durch Herunterladen der neuesten Version installiert werden.

8. Label Sleuth

https://github.com/label-sleuth/label-sleuth

Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Label Sleuth ist ein Open-Source-System ohne Code zur Textkennzeichnung und -klassifizierung. Es ermöglicht Experten aus Bereichen wie Ärzten, Anwälten und Psychologen, benutzerdefinierte NLP-Modelle ohne die Mitarbeit von NLP-Experten zu erstellen.

Normalerweise erfordert die Erstellung von NLP-Modellen Domänen- und maschinelles Lernwissen. Label Sleuth umgeht die Anforderung an NLP-Expertise durch intuitive Textanmerkung und KI-Modellerstellung. Während Benutzer Daten kennzeichnen, werden im Hintergrund Modelle für maschinelles Lernen trainiert, um Vorhersagen zu treffen und Vorschläge zu machen, was als nächstes zu kennzeichnen ist.

Als No-Code-System erfordert es keine Kenntnisse im Bereich maschinelles Lernen und ermöglicht eine schnelle Modellentwicklung, von der Aufgabendefinition bis zum fertigen Modell in nur wenigen Stunden.

9.Markup zum Beispiel: Entitätserkennung. Gleichzeitiges Lernen beim Annotieren, um komplexere Annotationen vorherzusagen und zu empfehlen, und bietet außerdem integrierten Zugriff auf allgemeine und benutzerdefinierte Ontologien für die Konzeptzuordnung. Funktionen:

Prädiktive Annotation: Die auf maschinellem Lernen basierende prädiktive Annotationsfunktion von Markup kann während der Arbeit komplexere Annotationen empfehlen und so den Annotationsprozess effizienter gestalten.

Integrierte Ontologie-Zugriffs-Tags: Bietet integrierten Zugriff auf eine Vielzahl gängiger Ontologien (z. B. UMLS, SNOMED-CT, ICD-10) sowie die Möglichkeit, benutzerdefinierte Ontologien für die Konzeptzuordnung hochzuladen. Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Prädiktive Ontologiezuordnung: Die prädiktive Ontologiezuordnungsfunktion von Markup nutzt maschinelles Lernen, um basierend auf dem von Ihnen kommentierten Text geeignete Zuordnungen zu Standard- und benutzerdefinierten Begriffen zu empfehlen.

Benutzerfreundliche Oberfläche: Egal, ob Sie ein technischer Experte oder ein Anfänger sind, die benutzerfreundliche Oberfläche von Markup macht es jedem leicht, mit minimalem Einrichtungsaufwand mit dem Kommentieren von Dokumenten zu beginnen.

  • 10.Potato
  • https://github.com/davidjurgens/potato

Potato ist ein webbasiertes Textanmerkungstool, das die schnelle Einrichtung und Bereitstellung verschiedener Textanmerkungen unterstützt Aufgabe. Kann als Webserver ausgeführt werden, der von einer einzigen Konfigurationsdatei gesteuert wird und keine Startprogrammierung erfordert. Aber Potato lässt sich leicht anpassen und erfordert in der Regel kein zusätzliches Webdesign, um die Benutzeroberfläche für Textkommentatoren anzupassen.

Hauptfunktionen:

Zehn empfohlene Open-Source-Tools für kostenlose TextanmerkungenEinfach einzurichten und anzupassen

Umfangreiche integrierte Muster und Vorlagen Zehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen

Unterstützt mehrere Datentypen

Unterstützt die Multitasking-Einrichtung

Mit Funktionen wie Tastaturkürzeln, dynamischer Hervorhebung und Beschriftungs-Tooltips Verbessern Anmerkungseffizienz
  • Besseres Verständnis der Fähigkeiten des Annotators, wie z. B. Fragen vor und nach dem Filter
  • Qualitätskontrollfunktionen, wie Aufmerksamkeitstests, Qualifikationstests und integrierte Zeitprüfungen

Das obige ist der detaillierte Inhalt vonZehn empfohlene Open-Source-Tools für kostenlose Textanmerkungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen