Maison >développement back-end >Tutoriel Python >Introduction à l'utilisation du greenlet Python et analyse de ses principes de mise en œuvre
J'ai récemment commencé à étudier la technologie de développement parallèle de Python, notamment le multi-threading, le multi-processus, la coroutine, etc. J'ai progressivement trié certaines informations sur Internet, et aujourd'hui j'ai trié les informations liées à greenlet.
Le traitement parallèle fait actuellement l'objet de beaucoup d'attention, car dans de nombreux cas, le calcul parallèle peut grandement améliorer le débit du système, en particulier à l'ère actuelle du multicœur et du multi- processeurs. Par conséquent, les langages anciens comme Lisp ont été repris et la programmation fonctionnelle est devenue de plus en plus populaire. Présentation d'une bibliothèque de traitement parallèle en python : greenlet. Python possède une bibliothèque très connue appelée stackless, qui est utilisée pour le traitement simultané. Elle utilise principalement un micro-thread appelé tasklet. La plus grande différence entre greenlet et stackless est qu'elle est très légère ? Pas assez. La plus grande différence est que greenlet vous oblige à gérer vous-même le changement de thread, c'est-à-dire que vous devez spécifier quel greenlet exécuter maintenant et quel greenlet exécuter à nouveau.
J'utilisais python pour développer des programmes Web et j'utilisais toujours le mode fastcgi. Ensuite, plusieurs threads sont démarrés dans chaque processus pour le traitement des requêtes. Besoins Assurez-vous que le temps de réponse de chaque requête est très court, sinon le serveur refusera le service tant que quelques requêtes plus lentes seront effectuées, car aucun thread ne peut répondre à la requête. Habituellement, les performances de nos services seront testées. allez en ligne, donc dans des circonstances normales, il n'y a pas beaucoup de gros problèmes. Mais il est impossible de tester tous les scénarios. Une fois que cela se produit, l'utilisateur attendra longtemps sans répondre, ce qui entraînera une indisponibilité totale. Plus tard, il a été converti en coroutine, greenlet sous python. J'en ai donc fait un mécanisme d'implémentation simple.
Chaque greenlet est juste un objet python (PyGreenlet) dans le tas. vous de créer des millions voire des dizaines de millions de greenlets pour un processus.
typedef struct _greenlet { PyObject_HEAD char* stack_start; char* stack_stop; char* stack_copy; intptr_t stack_saved; struct _greenlet* stack_prev; struct _greenlet* parent; PyObject* run_info; struct _frame* top_frame; int recursion_depth; PyObject* weakreflist; PyObject* exc_type; PyObject* exc_value; PyObject* exc_traceback; PyObject* dict; } PyGreenlet;
Chaque greenlet est en fait une fonction, et enregistre le contexte lorsque cette fonction est exécutée. Pour une fonction, le contexte est sa pile. Tous les greenlets du même processus partagent une pile utilisateur commune allouée par le système d'exploitation. Ainsi, en même temps, seuls les greenlets dont les données de pile ne sont pas en conflit peuvent utiliser cette pile globale. Si le stack_stop du greenlet à exécuter chevauche le greenlet actuellement dans la pile, il est nécessaire de sauvegarder temporairement les données de pile de ces greenlets qui se chevauchent dans le tas. La position enregistrée est enregistrée via stack_copy et stack_saved, de sorte que le Les positions de stack_stop et stack_start dans la pile peuvent être copiées du tas vers la pile pendant la récupération. Sinon, d'autres problèmes se produiront. Par conséquent, ces greenlets créés par l'application obtiennent la concurrence en copiant continuellement les données. du tas ou du tas à la pile. Il est vraiment confortable d'utiliser la coroutine pour les applications de type IO
Ce qui suit est un modèle spatial de pile simple de greenlet (de greenlet.c)
A PyGreenlet is a range of C stack addresses that must be saved and restored in such a way that the full range of the stack contains valid data when we switch to it. Stack layout for a greenlet: | ^^^ | | older data | | | stack_stop . |_______________| . | | . | greenlet data | . | in stack | . * |_______________| . . _____________ stack_copy + stack_saved . | | | | . | data | |greenlet data| . | unrelated | | saved | . | to | | in heap | stack_start . | this | . . |_____________| stack_copy | greenlet | | | | newer data | | vvv |Ce qui suit est un simple code greenlet.
from greenlet import greenlet def test1(): print 12 gr2.switch() print 34 def test2(): print 56 gr1.switch() print 78 gr1 = greenlet(test1) gr2 = greenlet(test2) gr1.switch()Actuellement, les coroutines discutées sont généralement prises en charge par les langages de programmation. À l'heure actuelle, les langages que je connais qui fournissent un support coroutine incluent python, lua, go, erlang, scala et rust. La différence entre les coroutines et les threads est que les coroutines ne sont pas commutées par le système d'exploitation, mais par le codage des
programmeurs En d'autres termes, la commutation est contrôlée par le programmeur, il n'y a donc pas de soi-disant thread de sécurité. Question.
Toutes les coroutines partagent le contexte de l'ensemble du processus, donc l'échange entre coroutines est également très pratique. Par rapport à la deuxième solution (multiplexage d'E/S), les programmes écrits à l'aide de coroutines seront plus intuitifs, plutôt que de diviser un processus complet en plusieurs gestionnaires d'événements gérés. L'inconvénient des coroutines peut être qu'elles ne peuvent pas tirer parti du multicœur, mais cela peut être résolu par des coroutines + des processus. Les coroutines peuvent être utilisées pour gérer la concurrence afin d'améliorer les performances, et peuvent également être utilisées pour implémenter des machines à états afin de simplifier la programmation. J'utilise davantage le deuxième. Je suis entré en contact avec python à la fin de l'année dernière et j'ai découvert le concept de coroutine de python. Plus tard, je suis entré en contact avec le traitement de rendement via pycon china2011. Greenlet est également une solution de coroutine, et à mon avis, c'est une solution plus. solution utilisable, notamment pour le traitement des machines à états. À l'heure actuelle, cette partie est pratiquement terminée. Je prendrai le temps de la résumer plus tard. Pour résumer : 1) Plusieurs processus peuvent tirer parti du multicœur, mais la communication inter-processus est gênante. De plus, une augmentation du nombre de processus entraînera une dégradation des performances et. le coût du changement de processus est plus élevé. La complexité du flux de programme est inférieure à celle du multiplexage d'E/S. 2) Le multiplexage d'E/S consiste à traiter plusieurs processus logiques au sein d'un processus sans commutation de processus. Les performances sont élevées et le partage d'informations entre les processus est simple. Cependant, les avantages du multicœur ne peuvent pas être exploités. De plus, le déroulement du programme est découpé en petits morceaux par le traitement des événements, ce qui rend le programme plus complexe et difficile à comprendre. 3) Les threads s'exécutent au sein d'un processus et sont planifiés par le système d'exploitation. De plus, ils partagent l'espace d'adressage virtuel du processus, ce qui facilite le partage d'informations entre les threads. Cependant, les problèmes de sécurité des threads entraînent une courbe d’apprentissage abrupte pour les threads et sont sujets aux erreurs.4) Les coroutines sont fournies par les langages de programmation et sont commutées sous le contrôle des programmeurs, il n'y a donc aucun problème de sécurité des threads et peuvent être utilisées pour gérer les machines à états, les requêtes simultanées, etc. Mais je ne peux pas profiter du multicœur.
Les quatre solutions ci-dessus peuvent être utilisées ensemble. Je suis plus optimiste quant au modèle processus + coroutine
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!