Heim  >  Artikel  >  Java  >  10 empfohlene Artikel über chinesische Wortsegmentierer

10 empfohlene Artikel über chinesische Wortsegmentierer

黄舟
黄舟Original
2017-06-12 11:38:072211Durchsuche

Die Ziele dieses Artikels sind zwei: 1. Lernen Sie, die 11 wichtigsten Open-Source-Wortsegmentierer für Java zu verwenden. 2. Analysieren Sie die Wortsegmentierungseffekte der 11 wichtigsten Open-Source-Wortsegmentierer für Java. Dieser Artikel beschreibt die Verwendungsmethoden und Wortsegmentierung der 11 wichtigsten Java-Open-Source-Wortsegmentierer für Chinesisch. Beim Vergleich der Ergebnisse mit den Codes sollte der Benutzer anhand seiner eigenen Anwendungsszenarien selbst beurteilen, welcher davon die bessere Wirkung hat. 11 wichtige Java-Open-Source-Wortsegmentierer haben unterschiedliche Verwendungen und definierte Schnittstellen. Definieren wir zunächst eine einheitliche Schnittstelle: /*** Erhalten Sie alle Wortsegmentierungsergebnisse des Textes und vergleichen Sie die Ergebnisse verschiedener Wortsegmentierer * @Autor Yang Shangchuan ​*/. öffentliche Schnittstelle WordSegmenter { /** * Erhalten Sie alle Wortsegmentierungsergebnisse des Textes  

1. Detaillierte Erläuterung der Verwendung von Java Open Source 11 chinesischen Wortsegmentierern und Vergleich der Wortsegmentierungseffekte

10 empfohlene Artikel über chinesische Wortsegmentierer

Einleitung: Die Ziele dieses Artikels sind zwei: 1. Erlernen Sie die Verwendung der 11 wichtigsten chinesischen Open-Source-Wortsegmentierer in Java. 2. Analysieren Sie vergleichend die Wortsegmentierungseffekte der 11 wichtigsten Java-Open-Source-Chinesisch-Wortsegmentierer In diesem Artikel werden die 11 wichtigsten Informationen zur Verwendung der Java-Open-Source-Chinesisch-Wortsegmentierung und der Vergleichscode für die Wortsegmentierungsergebnisse beschrieben. Welcher Code besser ist, muss der Benutzer anhand seiner eigenen Anwendungsszenarien beurteilen. 11 wichtige Java-Open-Source-Wortsegmentierer. Verschiedene Wortsegmentierer haben unterschiedliche Verwendungen und unterschiedliche definierte Schnittstellen. Definieren wir zunächst eine einheitliche Schnittstelle: /** * Holen Sie sich alle Wortsegmentierungsergebnisse des Textes und vergleichen Sie die Ergebnisse verschiedener Wortsegmentierer Yang Shangchuan..

2. Schreiben Sie einen einfachen chinesischen Wortsegmentierer in Python

10 empfohlene Artikel über chinesische Wortsegmentierer

Einführung: Nehmen Sie nach dem Entpacken die folgenden Dateien heraus: Trainingsdaten: icwb2-data/training/pku_training.utf8 Testdaten: icwb2-data/testing/pku_test.utf8 Korrektes Ergebnis der Wortsegmentierung : icw. ..

3. solr4.4.0 integriert carrot2, um Chinesisch zu unterstützen und wie Sie Ihren eigenen chinesischen Wortsegmentierer hinzufügen können

Einführung: Standardmäßig unterstützt carrot2 Chinesisch, es ist jedoch ein Parameter erforderlich, um carrot.lang= CHINESE_SIMPLIFIED anzugeben. Informationen zu den von carrot2 unterstützten Sprachen finden Sie unter http://doc.carrot2.org/#div .attribute.lingo.MultilingualClustering.defaultLanguage ist jedoch standardmäßig die von carrot2 verwendete Wortsegmentierungsklasse org.apache.luc

4 🎜>

Einführung: Robbe ist eine leistungsstarke PHP-Erweiterung für die Segmentierung chinesischer Wörter, die auf dem chinesischen Wortsegmentierer Friso basiert. Es unterstützt auch die Segmentierung der UTF-8/GBK-Kodierung. Robbe-1.6.0: 1. Ändern Sie die Schnittstelle so, dass sie für Friso-1.6.0 gilt. 2. Das UTF-8-Testprogramm wurde geändert, mehrere Konfigurationstestoptionen hinzugefügt und ein GBK-Testprogramm hinzugefügt. 3. rb_split geändert, das angepasst werden kann, um

zurückzugeben

Das obige ist der detaillierte Inhalt von10 empfohlene Artikel über chinesische Wortsegmentierer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn