Maison >Opération et maintenance >exploitation et maintenance Linux >Quelle est la différence entre sondage et sélection sous Linux ?
La différence entre poll et select sous Linux est la suivante : le nombre maximum de connexions pouvant être ouvertes par un seul processus de sélection est défini par la macro "FD_SETSIZE", et sa taille est de 32 entiers, tandis que poll utilise le stockage de liste chaînée, donc il n’y a pas de limite maximale de connexions.
L'environnement d'exploitation de ce tutoriel : système linux7.3, ordinateur Dell G3.
La sélection utilisée par chaque processus a une limite sur le nombre maximum de connexions, qui ne peut être que FD_SETSIZE, alors que poll n'a pas une telle restriction (en utilisant le stockage de liste chaînée) ;
epoll et select peuvent tous deux être fournis. Solution pour les E/S multiplexées. Tous peuvent être pris en charge dans le noyau Linux actuel, parmi lesquels epoll est unique à Linux, tandis que select doit être stipulé par POSIX et implémenté dans les systèmes d'exploitation généraux
select :
select est essentiellement stocké via des paramètres ou des vérifications. Les données. La structure du bit d'indicateur fd est utilisée pour l'étape suivante du traitement. Les inconvénients sont les suivants :
1. Le nombre de fds pouvant être surveillés par un seul processus est limité, c'est-à-dire que la taille du port d'écoute est limitée.
De manière générale, ce numéro est étroitement lié à la mémoire système. Le numéro spécifique peut être consulté par cat /proc/sys/fs/file-max. La valeur par défaut pour les machines 32 bits est 1024. La valeur par défaut pour les machines 64 bits est 2048.
2. Lors de l'analyse du socket, il s'agit d'un scan linéaire, c'est-à-dire que la méthode d'interrogation est utilisée, ce qui est moins efficace :
Lorsqu'il y a plusieurs sockets, select() doit être transmis à chaque fois que Traverse FD_SETSIZE Sockets pour terminer la planification. Quel que soit le Socket actif, tous sont parcourus. Cela gaspille beaucoup de temps CPU. Si vous pouvez enregistrer une fonction de rappel pour le socket et effectuer automatiquement les opérations associées lorsqu'elles sont actives, alors l'interrogation est évitée. C'est ce que font epoll et kqueue.
3. Il est nécessaire de maintenir une structure de données pour stocker un grand nombre de fd, ce qui entraînera une surcharge de copie élevée lors du transfert de la structure entre l'espace utilisateur et l'espace noyau.
poll :
poll est essentiellement le même. comme select.Ce sera Le tableau transmis par l'utilisateur est copié dans l'espace du noyau, puis l'état du périphérique correspondant à chaque fd est interrogé. Si le périphérique est prêt, un élément est ajouté à la file d'attente du périphérique et la traversée continue. . Si aucun périphérique prêt n'est trouvé après avoir parcouru tous les fd, le système se bloque, jusqu'à ce que le périphérique soit prêt ou que l'initiative expire, parcourra à nouveau le fd après avoir été réveillé. Ce processus a traversé de nombreuses traversées inutiles.
Il n'a pas de limite sur le nombre maximum de connexions car il est stocké sur la base d'une liste chaînée, mais il a aussi un inconvénient :
1 Un grand nombre de tableaux fd sont copiés dans leur ensemble entre le mode utilisateur et le mode utilisateur. l'espace d'adressage du noyau, quel que soit l'espace d'adressage du noyau. Une telle réplication a-t-elle un sens ?
2. Une autre fonctionnalité du sondage est le "déclenchement horizontal". Si un fd est signalé mais n'est pas traité, le fd sera à nouveau signalé la prochaine fois qu'il sera interrogé.
epoll :
epoll a deux modes de déclenchement : EPOLLLT et EPOLLET LT est le mode par défaut et ET est le mode "haute vitesse". En mode LT, tant que le fd a encore des données à lire, epoll_wait renverra son événement à chaque fois pour rappeler au programme utilisateur de fonctionner. En mode ET (déclencheur sur front), il ne demandera qu'une seule fois jusqu'à ce qu'il y ait des données ensuite. Il n'y aura plus d'invite avant l'afflux, qu'il y ait ou non encore des données lisibles dans fd. Par conséquent, en mode ET, lors de la lecture d'un fd, son tampon doit être lu, c'est-à-dire jusqu'à ce que la valeur de retour de lecture soit inférieure à la valeur demandée, ou qu'une erreur EAGAIN soit rencontrée. Une autre fonctionnalité est qu'epoll utilise la méthode de notification de préparation "événement" pour enregistrer le fd via epoll_ctl. Une fois le fd prêt, le noyau utilisera un mécanisme de rappel de type rappel pour activer le fd, et epoll_wait pourra recevoir la notification.
Pourquoi epoll a-t-il le mode de déclenchement EPOLLET ?
Si le mode EPOLLLT est adopté, une fois qu'il y aura un grand nombre de descripteurs de fichiers prêts dans le système que vous n'avez pas besoin de lire ou d'écrire, ils reviendront à chaque appel de epoll_wait, ce qui réduira considérablement l'efficacité du gestionnaire pour récupérer les descripteurs de fichiers prêts qui l'intéressent. Si le mode de déclenchement sur front d'EPOLLET est utilisé, lorsqu'un événement lisible et inscriptible se produit sur le descripteur de fichier surveillé, epoll_wait() demandera au gestionnaire de lire et d'écrire. Si toutes les données ne sont pas lues et écrites cette fois (par exemple, le tampon de lecture-écriture est trop petit), il ne vous en informera pas la prochaine fois que vous appellerez epoll_wait(), c'est-à-dire qu'il ne vous en informera qu'une seule fois jusqu'à ce que le descripteur de fichier est Vous ne serez pas averti jusqu'à ce que le deuxième événement lisible et inscriptible se produise ! ! ! Ce mode est plus efficace que le déclenchement horizontal, et le système ne sera pas inondé d'un grand nombre de descripteurs de fichiers prêts dont vous ne vous souciez pas. Avantages d'epoll :
1. , et la limite supérieure des FD pouvant être ouverts est bien supérieure à 1024 (1 Go de mémoire peut surveiller environ 100 000 ports)
2 L'efficacité est améliorée, ce n'est pas une méthode d'interrogation et l'efficacité ne diminuera pas au fur et à mesure ; le nombre de FD augmente. Seuls les FD actifs et disponibles appelleront la fonction de rappel ; Le plus grand avantage d'Epoll est qu'il ne se soucie que de vos connexions "actives" et n'a rien à voir avec le nombre total de connexions. Par conséquent, dans l'environnement réseau réel, le nombre total de connexions est important. l'efficacité d'Epoll sera bien supérieure à celle de la sélection et du sondage. 3. Copie de mémoire, utilisez la mémoire de mappage de fichiers mmap() pour accélérer la transmission des messages avec l'espace du noyau ; c'est-à-dire qu'epoll utilise mmap pour réduire la surcharge de copie.Select, poll, epoll Résumé des différences :
1 Prend en charge le nombre maximum de connexions pouvant être ouvertes par un processus
select
Le nombre maximum de connexions pouvant être ouvertes par un seul. Le processus est défini par la macro FD_SETSIZE, et sa taille est de 32 entiers (sur une machine 32 bits, la taille est de 3232, et de même sur une machine 64 bits, FD_SETSIZE est de 3264). modifiez-le et recompilez le noyau, mais les performances peuvent être affectées, ce qui nécessite des tests supplémentaires.
poll
poll est essentiellement la même chose que select, mais il n'a pas de limite sur le nombre maximum de connexions, car il est stocké sur la base d'une liste chaînée
epoll
Bien qu'il y ait une limite supérieure sur le nombre de connexions, il est très grand, une machine avec 1G de mémoire Elle peut ouvrir environ 100 000 connexions, et une machine avec 2G de mémoire peut ouvrir environ 200 000 connexions
2 problèmes d'efficacité IO causés par la forte augmentation de FD
select.
Parce que la connexion sera traitée à chaque fois qu'elle est appelée Traversée linéaire, donc à mesure que FD augmente, cela provoquera un "problème de performances de déclin linéaire" avec une vitesse de traversée lente.
poll
Idem que ci-dessus
epoll
Étant donné que l'implémentation dans le noyau epoll est basée sur la fonction de rappel sur chaque fd, seules les sockets actives appelleront activement le rappel, donc lorsqu'il y a moins de sockets actives, vous n'utilisez pas epoll Il y a le problème de baisse linéaire des performances des deux précédents, mais lorsque tous les sockets sont actifs, il peut y avoir des problèmes de performances.
3. Méthode de livraison des messages
select
Le noyau doit transmettre les messages à l'espace utilisateur, ce qui nécessite une action de copie du noyau
poll
Identique à ci-dessus
epoll
epoll est obtenu en partageant une mémoire entre le noyau et l'espace utilisateur de.
Résumé :
Pour résumer, lorsque vous choisissez select, poll ou epoll, vous devez tenir compte des occasions d'utilisation spécifiques et des caractéristiques de ces trois méthodes.
1. En apparence, epoll a les meilleures performances, mais lorsque le nombre de connexions est faible et que les connexions sont très actives, les performances de sélection et de sondage peuvent être meilleures que celles d'epoll. Après tout, le mécanisme de notification d'epoll nécessite de nombreuses fonctions. rappels.
2. Select est inefficace car il doit être interrogé à chaque fois. Mais l'inefficacité est aussi relative, selon la situation, elle peut aussi être améliorée grâce à une bonne conception
Apprentissage recommandé : Tutoriel vidéo Linux
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!