Maison >développement back-end >tutoriel php >Appelez cjieba en utilisant le FFI de PHP
Recommandé : "Tutoriel vidéo PHP"
phpjieba_ffi
Utilisez le test FFI de PHP 7.4 pour directement appelez cjieba La raison pour laquelle vous avez choisi CJieba pour la bibliothèque dynamique de segmentation de mots
est que FFI utilise la convention d'appel C. Si vous utilisez Cpp, vous devez le packager vous-même, puis extern C pour laisser le compilateur générer un. bibliothèque dynamique C standard.
Problèmes rencontrés
Défaut de segmentation
La variable C n'est pas initialisée
C est appelé directement Fonctions qui n'ont pas été initialisés par FFI sont appelés
Le jugement non nul nécessite l'utilisation de FFI::isNull($x)
Les tableaux sous forme de pointeurs ne peuvent pas être utilisés foreach
.Boucle de tableau de forme de pointeur
En regardant le code C, nous avons constaté que la partie Cut est la suivante :
CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) { cppjieba::Jieba* x = (cppjieba::Jieba*)handle; vector<string> words; string s(sentence, len); x->Cut(s, words); CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1)); size_t offset = 0; for (size_t i = 0; i < words.size(); i++) { res[i].word = sentence + offset; res[i].len = words[i].size(); offset += res[i].len; } if (offset != len) { free(res); return NULL; } res[words.size()].word = NULL; res[words.size()].len = 0; return res; }
Renvoie un pointeur de structure en C. langage, le nom du tableau est en fait l'adresse du pointeur de la première variable du tableau, elle peut donc être parcourue via l'opération d'adresse du pointeur ++ Et dans FFI ?
Pour ce tableau, j'ai d'abord utilisé une boucle foreach et j'ai directement signalé une erreur de segment. Plus tard, comme C, j'ai directement utilisé pointer++ et j'ai trouvé que c'était faisable. Je donne un coup de pouce à FFI ici car c'est le cas. peut également être utilisé directement.
Acquisition des résultats de segmentation de mots
Comme le montre le code ci-dessus, pour une segmentation de mot unique CJiebaWord, il ne s'agit pas de la segmentation de mots enregistrée, mais de la phrase + décalage, c'est-à-dire que le résultat de la segmentation du premier mot est définitivement une chaîne brute.
Dans la démo C, il est formaté par printf (. indique la largeur et l'alignement du champ), mais il n'existe pas de méthode similaire en PHP. Vous devez intercepter la chaîne substr($x->word, 0. , $x- >len)
for (x = words; x->word; x++) { printf("%*.*s\n", x->len, x->len, x->word); }
Exemple d'utilisation
Compiler la bibliothèque dynamique
make libjieba.so
Exécuter
time php demo.php
Exécuter la démo c
make demo time ./demo
Résultats
PHP load: 0.00025701522827148 real 1m59.619s user 1m56.093s sys 0m3.517s C real 1m54.738s user 1m50.382s sys 0m4.323s CPU 占用 基本都是 12%
Vous pouvez constater qu'en utilisant FFI, la vitesse de PHP est fondamentalement la même que celle de C. Si vous avez une entreprise qui prend beaucoup de temps CPU, vous pouvez essayer d'utiliser d'autres langages (C/C++, golang, Rust, etc.) pour écrire puis exporter une bibliothèque dynamique C standard.
Utilisation de FFI
Avant FFI, où des appels système ou des appels SDK étaient requis, PHP devait développer des extensions, mais le développement d'extensions nécessitait non seulement une compréhension du langage C, il faut quand même comprendre le noyau PHP, ce qui est plus difficile. Maintenant c'est beaucoup plus pratique, vous pouvez directement utiliser FFI pour appeler la bibliothèque dynamique.
Extension étendue des macros
Par exemple, le SDK de Hikvision possède un grand nombre de macros gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h prend en charge la définition de type, la sensation libre de l'utiliser
Adresse originale : https://github.com/dwdcth/phpjieba_ffi
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!