Maison >développement back-end >tutoriel php >Appelez cjieba en utilisant le FFI de PHP

Appelez cjieba en utilisant le FFI de PHP

藏色散人
藏色散人avant
2020-11-19 15:21:404202parcourir

Recommandé : "Tutoriel vidéo PHP"

phpjieba_ffi

Utilisez le test FFI de PHP 7.4 pour directement appelez cjieba La raison pour laquelle vous avez choisi CJieba pour la bibliothèque dynamique de segmentation de mots

est que FFI utilise la convention d'appel C. Si vous utilisez Cpp, vous devez le packager vous-même, puis extern C pour laisser le compilateur générer un. bibliothèque dynamique C standard.

Problèmes rencontrés

Défaut de segmentation

La variable C n'est pas initialisée

C est appelé directement Fonctions qui n'ont pas été initialisés par FFI sont appelés

Le jugement non nul nécessite l'utilisation de FFI::isNull($x)

Les tableaux sous forme de pointeurs ne peuvent pas être utilisés foreach

.

Boucle de tableau de forme de pointeur

En regardant le code C, nous avons constaté que la partie Cut est la suivante :

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

Renvoie un pointeur de structure en C. langage, le nom du tableau est en fait l'adresse du pointeur de la première variable du tableau, elle peut donc être parcourue via l'opération d'adresse du pointeur ++ Et dans FFI ?

Pour ce tableau, j'ai d'abord utilisé une boucle foreach et j'ai directement signalé une erreur de segment. Plus tard, comme C, j'ai directement utilisé pointer++ et j'ai trouvé que c'était faisable. Je donne un coup de pouce à FFI ici car c'est le cas. peut également être utilisé directement.

Acquisition des résultats de segmentation de mots

Comme le montre le code ci-dessus, pour une segmentation de mot unique CJiebaWord, il ne s'agit pas de la segmentation de mots enregistrée, mais de la phrase + décalage, c'est-à-dire que le résultat de la segmentation du premier mot est définitivement une chaîne brute.

Dans la démo C, il est formaté par printf (. indique la largeur et l'alignement du champ), mais il n'existe pas de méthode similaire en PHP. Vous devez intercepter la chaîne substr($x->word, 0. , $x- >len)

  for (x = words; x->word; x++) {
    printf("%*.*s\n", x->len, x->len, x->word);
  }

Exemple d'utilisation

Compiler la bibliothèque dynamique

make libjieba.so

Exécuter

time php demo.php

Exécuter la démo c

make demo
time ./demo

Résultats

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%

Vous pouvez constater qu'en utilisant FFI, la vitesse de PHP est fondamentalement la même que celle de C. Si vous avez une entreprise qui prend beaucoup de temps CPU, vous pouvez essayer d'utiliser d'autres langages (C/C++, golang, Rust, etc.) pour écrire puis exporter une bibliothèque dynamique C standard.

Utilisation de FFI

Avant FFI, où des appels système ou des appels SDK étaient requis, PHP devait développer des extensions, mais le développement d'extensions nécessitait non seulement une compréhension du langage C, il faut quand même comprendre le noyau PHP, ce qui est plus difficile. Maintenant c'est beaucoup plus pratique, vous pouvez directement utiliser FFI pour appeler la bibliothèque dynamique.

Extension étendue des macros

Par exemple, le SDK de Hikvision possède un grand nombre de macros gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h prend en charge la définition de type, la sensation libre de l'utiliser

Adresse originale : https://github.com/dwdcth/phpjieba_ffi

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer