Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs

So verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs

坏嘻嘻Original: 2018-09-14 16:54:574866Durchsuche

In diesem Artikel wird hauptsächlich die Verwendung des IKAnalyzer-Wortsegmentierers zum Anpassen des erweiterten Wörterbuchs vorgestellt. Ich hoffe, Sie können geduldig lernen.

Nach dem Herunterladen des vollständigen IKAnalyzer-Distributionspakets enthält das IK-Analyzer-Installationspaket:
1. „IKAnalyzer Chinese Word Segmenter V2012 User Manual“
2. IKAnalyzer2012.jar (Haupt-JAR-Paket)
3 . IKAnalyzer.cfg.xml (Word-Segmenter-Erweiterungskonfigurationsdatei)
4. stopword.dic (Stoppwörterbuch)
5. LICENSE.TXT (Apache-Copyright-Erklärung)
Seine Installation und Die Bereitstellung ist sehr einfach. Stellen Sie die Dateien IKAnalyzer2012.jar im lib-Verzeichnis des Projekts bereit -INF/classes-Verzeichnis, derselbe Ruhezustand, log4j und andere Konfigurationsdateien sind gleich).

Um das benutzerdefinierte Wörterbuch zu erweitern, öffnen Sie IKAnalyzer.cfg.xml

So verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs und entfernen Sie die Kommentare des erweiterten Wörterbuchs.

So verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs Erstellen Sie gleichzeitig eine neue ext.dic-Datei im Stammverzeichnis der Klasse, also im Ordner src. Nachdem es erstellt wurde, öffnen Sie ext.dic mit der Notepad++-Software.

So verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs Verwandte Empfehlungen:

Detaillierte Erläuterung der Verwendung von Java Open Source 11 chinesischen Wortsegmentierern und Vergleich der Wortsegmentierungseffekte

Verwenden des Discuz-Keyword-Servers zur Implementierung der PHP-Segmentierung chinesischer Wörter_PHP-Tutorial

Das obige ist der detaillierte Inhalt vonSo verwenden Sie den IKAnalyzer-Tokenizer zum Anpassen des erweiterten Wörterbuchs. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Informationen zu Python-Unterstrich-NutzungsszenarienNächster Artikel：Informationen zu Python-Unterstrich-Nutzungsszenarien

In Verbindung stehende Artikel

Mehr sehen