Maison >Tutoriel système >Linux >Suivi des appels système Syscall du noyau Linux

Suivi des appels système Syscall du noyau Linux

WBOY
WBOYavant
2024-02-12 21:21:14475parcourir

Dans l'espace utilisateur Linux, nous avons souvent besoin d'appeler des appels système. Prenons la version Linux 2.6.37 comme exemple pour suivre l'implémentation de l'appel système read. Les implémentations des appels système peuvent varier selon les versions de Linux.

Suivi des appels système Syscall du noyau Linux

Dans certaines applications, on peut voir la définition suivante :

scssCopy code
#define real_read(fd, buf, count ) (syscall(SYS_read, (fd), (buf), (count)))

En fait, ce qu'on appelle en réalité est la fonction système syscall(SYS_read), c'est-à-dire la fonction sys_read(). Dans la version Linux 2.6.37, cette fonction est implémentée via plusieurs définitions de macros.

L'appel système Linux (SCI, interface d'appel système) est en fait un processus d'agrégation et de décomposition multicanal. Le point d'agrégation est le point d'entrée de l'interruption 0x80 (structure système X86). C'est-à-dire que tous les appels système sont regroupés depuis l'espace utilisateur jusqu'au point d'interruption 0x80, et le numéro d'appel système spécifique est enregistré en même temps. Lorsque le gestionnaire d'interruption 0x80 est en cours d'exécution, différents appels système seront traités séparément en fonction du numéro d'appel système, c'est-à-dire que différentes fonctions du noyau seront appelées pour le traitement.

Il existe deux manières de provoquer des appels système :

(1) int $0×80, c'était le seul moyen de provoquer un appel système dans les anciennes versions du noyau Linux.

(2) instructions de montage du Sysenter

Dans le noyau Linux, nous pouvons utiliser les définitions de macros suivantes pour effectuer des appels système.

SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)
{
    struct file *file;
    ssize_t ret = -EBADF;
    int fput_needed;

    file = fget_light(fd, &fput_needed);
    if (file) {
        loff_t pos = file_pos_read(file);
        ret = vfs_read(file, buf, count, &pos);
        file_pos_write(file, pos);
        fput_light(file, fput_needed);
    }

    return ret;
}

La définition macro de SYSCALL_DEFINE3 est la suivante :

#define SYSCALL_DEFINE3(name, ...) SYSCALL_DEFINEx(3, _##name, __VA_ARGS__)

## signifie remplacer directement les caractères dans la macro,
Si name = read, alors __NR_##name est remplacé par __NR_read dans la macro. NR##name est le numéro d'appel système, ## fait référence à deux extensions de macro. Autrement dit, remplacez "nom" par le nom réel de l'appel système, puis développez __NR.... Si nom == ioctl, c'est __NR_ioctl.

#ifdef CONFIG_FTRACE_SYSCALLS
#define SYSCALL_DEFINEx(x, sname, ...)                \
    static const char *types_##sname[] = {            \
        __SC_STR_TDECL##x(__VA_ARGS__)            \
    };                            \
    static const char *args_##sname[] = {            \
        __SC_STR_ADECL##x(__VA_ARGS__)            \
    };                            \
    SYSCALL_METADATA(sname, x);                \
    __SYSCALL_DEFINEx(x, sname, __VA_ARGS__)
#else
#define SYSCALL_DEFINEx(x, sname, ...)                \
    __SYSCALL_DEFINEx(x, sname, __VA_ARGS__)
#endif

Que la macro CONFIG_FTRACE_SYSCALLS soit définie ou non, la définition de macro suivante sera finalement exécutée :

__SYSCALL_DEFINEx(x, nom, VA_ARGS)

#ifdef CONFIG_HAVE_SYSCALL_WRAPPERS

#define SYSCALL_DEFINE(name) static inline 
long SYSC_##name

#define __SYSCALL_DEFINEx(x, name, ...)                    \
    asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__));        \
    static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__));    \
    asmlinkage long SyS##name(__SC_LONG##x(__VA_ARGS__))        \
    {                                \
        __SC_TEST##x(__VA_ARGS__);                \
        return (long) SYSC##name(__SC_CAST##x(__VA_ARGS__));    \
    }                                \
    SYSCALL_ALIAS(sys##name, SyS##name);                \
    static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__))

#else /*
 CONFIG_HAVE_SYSCALL_WRAPPERS */

#define SYSCALL_DEFINE(name) asmlinkage 
long sys_##name
#define __SYSCALL_DEFINEx(x, name, ...)                    \
    asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__))

#endif /*
 CONFIG_HAVE_SYSCALL_WRAPPERS */

Le type de définition de macro suivant sera éventuellement appelé :

asmlinkage long sys##name(__SC_DECL##x(VA_ARGS))
Il s'agit de la fonction système sys_read() que nous avons mentionnée plus tôt.
asmlinkage indique au compilateur d'extraire uniquement les arguments de la fonction de la pile. Tous les appels système nécessitent ce qualificatif ! Ceci est similaire à la définition de macro mentionnée dans notre article précédent quagga.

C'est-à-dire le code suivant dans la définition de la macro :

struct file *file;
    ssize_t ret = -EBADF;
    int fput_needed;

    file = fget_light(fd, &fput_needed);
    if (file) {
        loff_t pos = file_pos_read(file);
        ret = vfs_read(file, buf, count, &pos);
        file_pos_write(file, pos);
        fput_light(file, fput_needed);
    }

    return ret;

Analyse du code :

  • fget_light() : selon l'index spécifié par fd, récupérez l'objet fichier correspondant à partir du descripteur de processus actuel (voir Figure 3).
  • Si l'objet fichier spécifié n'est pas trouvé, une erreur est renvoyée
  • Si l'objet fichier spécifié est trouvé :
  • Appelez la fonction file_pos_read() pour obtenir la position actuelle du fichier lu et écrit cette fois.
  • Appelez vfs_read() pour effectuer une opération de lecture de fichier, et cette fonction appelle finalement la fonction pointée par file->f_op.read(). Le code est le suivant :
  • .

if (fichier->f_op->lire)
ret = fichier->f_op->read(fichier, buf, count, pos);

  • Appelez file_pos_write() pour mettre à jour la position actuelle de lecture et d’écriture du fichier.
  • Appelez fput_light() pour mettre à jour le nombre de références du fichier.
  • Enfin, le nombre d'octets de données lues est renvoyé.

À ce stade, le traitement effectué par la couche du système de fichiers virtuel est terminé et le contrôle est transféré à la couche du système de fichiers ext2.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer