Maison  >  Article  >  Java  >  10 articles recommandés sur les segmenteurs de mots chinois

10 articles recommandés sur les segmenteurs de mots chinois

黄舟
黄舟original
2017-06-12 11:38:072266parcourir

Les objectifs de cet article sont doubles : 1. Apprendre à utiliser les 11 principaux segmenteurs de mots chinois open source Java 2. Analyser de manière comparative les effets de segmentation de mots des 11 principaux segmenteurs de mots chinois open source Java Cet article donne les méthodes d'utilisation. et segmentation de mots des 11 principaux segmenteurs de mots chinois open source Java. En comparant les résultats avec les codes, pour savoir lequel a le meilleur effet, l'utilisateur doit le juger par lui-même en fonction de ses propres scénarios d'application. 11 principaux segmenteurs de mots chinois open source Java. Différents segmenteurs de mots ont des usages différents et des interfaces définies. Définissons d'abord une interface unifiée : /*** Obtenez tous les résultats de segmentation de mots du texte et comparez les résultats de différents segmenteurs de mots * @auteur Yang Shangchuan ​*/. interface publique WordSegmenter { /** * Obtenez tous les résultats de segmentation de mots du texte  

1. Explication détaillée de la façon d'utiliser Java open source 11 segmenteurs de mots chinois et comparaison des effets de segmentation de mots

10 articles recommandés sur les segmenteurs de mots chinois

Introduction : Les objectifs de cet article sont doubles : 1. Apprendre à utiliser les 11 principaux segmenteurs de mots chinois open source Java 2. Analyser de manière comparative les effets de segmentation de mots des 11 principaux Segmenteurs de mots chinois open source Java Cet article donne les 11 principaux modes d'utilisation de la segmentation de mots chinois open source Java et le code de comparaison des résultats de segmentation de mots. Quant à savoir lequel est le meilleur, l'utilisateur doit le juger en fonction de ses propres scénarios d'application. 11 principaux segmenteurs de mots chinois open source Java. Différents segmenteurs de mots ont des utilisations différentes et des interfaces définies différentes. Définissons d'abord une interface unifiée : /** * Obtenez tous les résultats de segmentation de mots du texte et comparez les résultats des différents segmenteurs de mots * @. auteur Yang Shangchuan..

2. Écrivez un segmenteur de mots chinois simple en Python

10 articles recommandés sur les segmenteurs de mots chinois

Introduction : Après avoir décompressé, sortez les fichiers suivants : Données d'entraînement : icwb2-data/training/pku_ training.utf8 Données de test : icwb2-data/testing/pku_ test.utf8 Segmentation correcte des mots résultat : icw..

3. solr4.4.0 intègre carrot2 pour prendre en charge le chinois et comment ajouter votre propre segmenteur de mots chinois

Introduction : Par défaut, carrot2 prend en charge le chinois, mais un paramètre est requis pour spécifier carrot.lang= CHINESE_SIMPLIFIED Pour les langues prises en charge par carrot2, veuillez vous référer à http://doc.carrot2.org/#. div.attribute.lingo.MultilingualClustering.defaultLanguage. Mais par défaut, la classe de segmentation de mots utilisée par carrot2 est org.apache.luc

Robbe-1.6.0 Release.

Introduction : Robbe est une extension de segmentation de mots chinois PHP haute performance construite sur le segmenteur de mots chinois Friso. Il prend également en charge la segmentation du codage UTF-8/GBK. Robbe-1.6.0 : 1. Modifiez l'interface pour l'appliquer à Friso-1.6.0. 2. Modification du programme de test UTF-8, ajout de plusieurs options de test de configuration et ajout d'un programme de test GBK. 3. Modification de rb_split, qui peut être personnalisé pour renvoyer


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn