Maison >Tutoriel système >Linux >Compétences essentielles pour les techniciens : méthodologie de résolution de problèmes – dépannage

Compétences essentielles pour les techniciens : méthodologie de résolution de problèmes – dépannage

WBOY
WBOYavant
2024-01-07 09:10:181504parcourir
Présentation Car de nombreux systèmes, notamment les systèmes informatiques ou certains systèmes électriques et systèmes de communication, fonctionnent 24h/24 et 7j/7. Si un défaut survient, notre personnel d'exploitation et de maintenance est tenu de trouver le défaut rapidement et de le résoudre ensuite de manière rapide et économique. Par exemple, certains systèmes hospitaliers qui soutiennent les opérations chirurgicales peuvent même menacer la vie du patient si un dysfonctionnement ne peut pas être résolu rapidement. Par conséquent, le dépannage est une compétence et une exigence technique très importante pour notre personnel d’exploitation et de maintenance.

Compétences essentielles pour les techniciens : méthodologie de résolution de problèmes – dépannage

Qu'est-ce que le dépannage ?

Le dépannage est le processus consistant à trouver la cause première d'un problème et à le corriger. L'objectif du dépannage est de remettre l'appareil/système dans un état de fonctionnement normal.

Parce que de nombreux systèmes, notamment les systèmes informatiques ou certains systèmes électriques et systèmes de communication, fonctionnent 24h/24 et 7j/7. Si un défaut survient, notre personnel d'exploitation et de maintenance est tenu de trouver le défaut rapidement et de le résoudre ensuite de manière rapide et économique. Par exemple, certains systèmes hospitaliers qui soutiennent les opérations chirurgicales peuvent même menacer la vie du patient si un dysfonctionnement ne peut pas être résolu rapidement. Par conséquent, le dépannage est une compétence et une exigence technique très importante pour notre personnel d’exploitation et de maintenance.

Le dépannage n'est pas seulement nécessaire au travail, mais aussi dans la vie. Il y a quelque temps, je jouais à Honor of Kings avec un ami et j'ai rencontré un bug. Chaque soir, lorsque je joue à ce jeu, vers 20 ou 21 heures, la qualité du réseau se dégrade et le fonctionnement devient très lent. Je suis très troublé. En tant que personnel d'exploitation et de maintenance, ou instinct du personnel technique, je me demande quel est le problème avec le réseau ? Comment le réparer? J'ai donc suivi un processus de dépannage. J'ai effectué quelques tests sur tous les réseaux sans fil de la maison et sur le haut débit de China Unicom, et j'ai essayé d'optimiser la configuration du routeur sans fil. Finalement, j'ai déterminé que les canaux 2,4G à proximité de notre maison et de nos voisins étaient trop encombrés et que les interférences étaient trop importantes. , donc pendant les heures de pointe du soir, tout le monde a des besoins Internet et va interférer les uns avec les autres. Plus tard, j'ai basculé la chaîne sur la 5G, le monde est devenu calme et j'ai pu jouer à des jeux en toute tranquillité d'esprit.

Approche générale pour résoudre les problèmes

Ensuite, j'y ai réfléchi, existe-t-il un processus ou une méthode très scientifique et standardisé. Si je suis cette méthode étape par étape, n'importe quel défaut ou problème peut être résolu ? Bien que les problèmes soient divers, les méthodes réelles de résolution de problèmes le sont également, et des processus de résolution de problèmes spécifiques peuvent être développés pour des scénarios et des problèmes spécifiques. Dans un travail spécifique, certaines personnes font du SA, d'autres du réseau et d'autres du DBA. Chaque direction spécifique aura des méthodes de dépannage liées à la profession et aux scénarios de problèmes.

Pour les problèmes courants, existe-t-il des solutions et des étapes communes qui peuvent être suivies ?

Il s'agit d'une méthode relativement générale résumée par l'auteur du livre "dépannage et maintenance du réseau IP Cisco". Il a divisé l'ensemble du processus de dépannage en 7 étapes, depuis la définition du problème, la collecte d'indices et d'informations, l'analyse, l'hypothèse et l'élimination des possibilités, et enfin la résolution du problème.

Lors du dépannage de certains systèmes complexes ou de problèmes complexes, nous pouvons suivre ce processus de solution pour résumer et définir le problème, puis le résoudre étape par étape.

Stratégies et techniques spécifiques

En dehors de ce processus et de cette méthode standard, nous pouvons rencontrer des problèmes relativement simples ou plus intuitifs, et nous pouvons utiliser des stratégies et des conseils spécifiques pour résoudre les problèmes plus rapidement.

Conditions préalables au dépannage

Nous rencontrons souvent le problème que le téléviseur ne répond pas lorsque l'interrupteur est allumé ? Pourquoi l'ordinateur ne peut-il pas s'allumer ? Ce problème est probablement dû à une coupure de courant ou à une panne de courant. Dérivé de cette question, tout système nécessite certaines conditions préalables ou préalables nécessaires pour fonctionner. Lorsqu'une anomalie se produit dans un système ou un service, vous devez revenir en arrière et comprendre quelles sont les dépendances du système et quelles sont ses conditions préalables. Si ces conditions existaient et étaient normales auparavant, mais maintenant les conditions ne sont pas remplies, donc certaines pannes se sont produites. .

Par exemple, si la moto s'arrête pendant la conduite, est-elle en panne d'essence ? Pour certains produits très matures ou bien commercialisés, comme l'iPhone, le manuel d'utilisation énumérera les conditions de fonctionnement normal et les conditions à éviter, comme les températures élevées et basses, etc., et fera une déclaration très claire. . définition.

Cependant, dans le processus d'exploitation et de maintenance de certains systèmes auto-développés, les documents et instructions de ces systèmes ne sont souvent pas particulièrement complets, de sorte que les conditions préalables doivent être étudiées en fonction des anomalies ou des problèmes du système. pour contacter le personnel de R&D ou les concepteurs. Effectuez une communication approfondie pour connaître certaines conditions préalables du système, puis utilisez-les comme indice pour le dépannage. Il s’agit de la première méthode de dépannage très basique. Tout le monde a résolu des problèmes similaires, et la plupart des problèmes sont souvent causés par des causes très courantes que notre expérience et notre intuition peuvent aider à résoudre.

Le système le plus rationalisé

Passons à la prochaine stratégie de résolution de problèmes. Quelqu'un a-t-il de l'expérience dans l'installation d'ordinateurs ? Un système informatique comporte de nombreux composants, tels que le processeur, la mémoire, l'alimentation, le châssis, le moniteur, le lecteur optique, la souris, l'audio, la carte réseau, etc. Lorsque nous installons l'ordinateur, nous n'avons pas besoin de tout installer en même temps. Nous installons souvent l'alimentation, la carte mère, le processeur et la mémoire, puis nous pouvons essayer si le système peut fonctionner normalement. Si le système peut s’allumer, cela signifie que le composant le plus important du système fonctionne correctement. Par conséquent, du point de vue du dépannage, lors de la localisation des défauts, vous pouvez essayer de rationaliser un système très complexe avec de nombreuses fonctions et composants dans le système le plus basique, une fois le test terminé, vous pouvez ensuite supprimer les autres composants du système un par un. afin que vous puissiez trouver et résoudre ce problème avec deux fois le résultat et la moitié de l'effort.

Restaurer l'état par défaut/redémarrer

L'autre scénario est similaire au premier scénario. Après une longue période de fonctionnement, le système ne fonctionne pas normalement. Comment le résoudre ? Redémarrage. Il existait une règle non écrite chez mon ancien employeur selon laquelle les systèmes importants devaient être vérifiés avant les vacances. S'ils n'ont pas été redémarrés pendant un certain nombre de jours, un redémarrage planifié serait organisé pour éviter un état anormal provoqué par un fonctionnement à long terme du système. .

Vous pouvez donc utiliser certaines solutions de redémarrage pour restaurer le défaut à l'état initial du système et résoudre le défaut. Il s'agit d'une méthode de résolution de défaut très puissante. Bien entendu, les conséquences imprévues doivent être prises en compte avant de redémarrer, comme un éventuel échec de démarrage qui pourrait entraîner des conséquences pires. En plus du redémarrage, vous pouvez également réinstaller/reconstruire le système pour faire une copie du système par défaut ou fonctionnel.

Remplacez un seul composant à la fois

Lorsque nous découvrons, grâce à une analyse et une localisation, que le défaut peut survenir dans un certain sous-système ou dans certains modules, existe-t-il un moyen de localiser rapidement le problème ? Vous pouvez essayer de remplacer l'une des pièces et la tester. En utilisant cette méthode, vous pouvez localiser avec précision le point de défaut étape par étape tout au long du dépannage, puis le résoudre. Cela nous fournit une expérience précieuse lorsque nous serons confrontés à des problèmes similaires à l’avenir. Lors de l'utilisation de cette méthode, il est important de noter qu'un seul composant est remplacé à la fois. Si d'autres composants doivent être remplacés une fois le test terminé, les modifications précédentes doivent d'abord être restaurées à leur état d'origine. Sinon, plusieurs problèmes peuvent survenir en raison de changements, affectant et interférant avec la résolution du problème.

Écrit à la fin

Le dépannage est à la fois une science et un art. De plus, vous pouvez également essayer de reproduire le problème, modifier la séquence de démarrage et de configuration, etc. En pratique, en fonction du temps, des ressources, des conditions et des restrictions du scénario, choisissez la stratégie la plus adaptée pour réaliser le dépannage. Bon dépannage !

Présentation de l'auteur

Teng Chuanyong, architecte Cloud Meituan. Il a participé à des travaux d'exploitation et de maintenance de systèmes et de services chez Baidu et eBay. Son travail implique l'exploitation et la maintenance de services de base, le déploiement et l'optimisation de systèmes à grande échelle, la virtualisation, etc. A rejoint Meituan en 2012 et est responsable de l'exploitation et de la maintenance, en se concentrant principalement sur l'exploitation et la maintenance des services de base, la construction de centres de données et de réseaux, la construction et l'exploitation et la maintenance d'environnements de cloud computing, etc.

L'article provient du compte public WeChat : Développement, exploitation et maintenance efficaces

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer