Maison > Article > Tutoriel système > Trois compétences essentielles pour les opérations et la maintenance au niveau de l'entreprise
Présentation | Bonjour à tous, Pékin est très encombré le matin et certains invités peuvent encore être sur la route à cette heure, je vais donc commencer par vous donner quelques conseils. Le thème que je partage cette fois-ci est « Tendances des opérations agiles et pratiques de gestion ». En matière d'exploitation et de maintenance, l'exploitation et la maintenance à l'ère du Big Data sont confrontées à trois problèmes majeurs : l'activité, l'échelle et l'équipe. Cela nous fait penser à la lutte passive contre les incendies et à la responsabilité lorsque l'on parle de l'exploitation et de la maintenance de l'informatique d'entreprise. systèmes. Comment pouvons-nous effectuer nos travaux d’exploitation et de maintenance pour éliminer les risques avant que des pannes ne surviennent ? Comment pouvons-nous nous débarrasser des méthodes traditionnelles d’exploitation et d’entretien de la chair humaine, lourdes, inefficaces et à haut risque ? Comment pouvons-nous présenter notre valeur et notre présence dans l’entreprise de manière plus intuitive ? Ces problèmes sont devenus particulièrement urgents maintenant que l’AIOps est largement évoquée. |
Cheng Yongxin, directeur et directeur général adjoint de Xinju Network
Alors, en tant que personnel d'exploitation et de maintenance, comment devrions-nous rechercher le changement de manière proactive ? Ici, je partage une idée, qui correspond aux « trois piliers de l'exploitation et de la maintenance agiles au niveau de l'entreprise », à savoir la présentation visuelle de la valeur, l'efficacité de la libération de l'automatisation et les capacités de conduite intelligente.
1. Valeur visuellement présenteSur le marché des logiciels, il existe une grande différence entre les pays nationaux et étrangers. En fait, pour être honnête, la visualisation des logiciels étrangers n'est pas aussi bonne que celle des logiciels nationaux. Pourquoi? Parce que tous ces logiciels étrangers sont appelés logiciels-outils, et que ces logiciels-outils sont utilisés par des personnes qui travaillent, donc que ces logiciels-outils étrangers soient open source ou commerciaux, ils ne sont en fait pas si bons. Mais c'est différent en Chine. Ce que les dirigeants des entreprises nationales veulent voir davantage, c'est : vous avez dit que j'avais un problème, d'accord, je veux voir où se situe le problème. D'un point de vue purement technique, vous constaterez peut-être que vous ne pouvez pas. expliquez-le clairement même si vous l'expliquez longtemps, donc à ce moment-là, la visualisation devient encore plus importante. D'une part, il est nécessaire que nos opérateurs fassent leur propre travail. comment présenter cette valeur au client et aux dirigeants, et comment notre travail peut être vu, c'est très important.
Au niveau de la visualisation, notre approche consiste à connecter verticalement la couche application, la couche plateforme et la couche appareil, à accéder horizontalement à l'équipement informatique de l'ensemble du réseau, à collecter les données de l'ensemble du réseau et à les combiner avec des algorithmes spécifiques pour les afficher.
Par exemple, Xinju Network présente concrètement la santé de tous les appareils via un formulaire de notation auto-développé, qui permet aux utilisateurs de découvrir, d'analyser et de résoudre les problèmes du premier coup grâce à l'application APM auto-développée, il enterre automatiquement les points vers lesquels obtenir une perspective sur le processus de transaction, et les données pertinentes sont analysées et stockées pour réaliser la décomposition du processus d'appel et la localisation rapide des problèmes de performances. Il réalise véritablement une visualisation transparente à tout moment, n'importe où et sur l'ensemble du réseau, et prend en charge plusieurs écrans tels que l'application, l'interface de travail Web et l'affichage sur grand écran pour présenter le contenu et la valeur du travail.
2. L'automatisation libère l'efficacitéIl va sans dire que l'automatisation libère l'efficacité. Pour notre fonctionnement et notre maintenance, si nous pouvons passer plus de temps à lire, étudier et rechercher, notre propre technologie peut être un peu améliorée. C'est la meilleure chose pour nous, n'a-t-il pas dit. faisait un travail répétitif toute la journée.
En fait, nous avons fait de l'automatisation. Je pense que tous ceux qui l'ont fait savent qu'il existe de nombreux pièges dans ce processus. Comment pouvons-nous surmonter ces pièges ? Les principaux objectifs de l’automatisation sont, premièrement, d’améliorer l’efficacité, deuxièmement, d’être sûre et contrôlable, et troisièmement, de réduire la dépendance à l’égard du personnel. Pour atteindre ces trois points, nous devons comprendre : tous les processus de normalisation qui ne sont pas solidifiés dans la plate-forme sont inutiles ; toute construction de plate-forme d'exploitation et de maintenance qui n'est pas basée sur des scénarios est vide.
À cet égard, notre approche est la suivante :
La première étape consiste à mettre en œuvre huit scénarios d'exploitation et de maintenance automatisés, y compris les opérations d'exploitation et de maintenance automatisées et l'activation et le déploiement automatisés des ressources, couvrant plus de 90 % des scénarios de travaux d'exploitation et de maintenance. Parce que du point de vue de l'exploitation et de la maintenance, si nous voulons rendre l'exploitation et la maintenance plus agiles, cela doit être basé sur des scénarios. Quel est mon scénario commercial ? Ce scénario commercial est-il réel, est-il vraiment utile pour l'exploitation et la maintenance de la production, s'agit-il simplement d'une préférence personnelle, y a-t-il un échec temporaire, la direction est sous forte pression, ou quoi, il faut donc le clarifier.
La deuxième étape consiste à parvenir à une exploitation et une maintenance sûres et efficaces grâce à une gestion centralisée et automatisée de l'exploitation et de la maintenance, et à constituer des actifs de connaissances pour garantir un transfert efficace des connaissances.
La troisième étape consiste à prendre en charge l'ouverture d'API pour les capacités d'exploitation et de maintenance automatisées : encapsuler les capacités d'exploitation et de maintenance automatisées dans des API pour les appels par divers systèmes et terminaux. Par exemple, les opérations d'exploitation et de maintenance peuvent être effectuées directement sur le téléphone mobile et le système. topologie.
La quatrième étape consiste à créer une plate-forme PaaS automatisée d'exploitation et de maintenance : prendre en charge le développement personnalisé de scénarios et piloter la transformation des capacités de l'équipe d'exploitation et de maintenance. Le travail de normalisation doit être solidifié dans la plate-forme. Une normalisation qui n'est pas intégrée à la plate-forme est inutile, et l'exploitation et la maintenance sans exploitation et maintenance basées sur des scénarios sont vides. Pensez au nombre de fonctions des applications traditionnelles qui ne sont pas des fonctions d'application de scène, et au nombre d'entreprises qui ont rédigé un ensemble de normes : normes opérationnelles, normes d'exploitation et de maintenance, spécifications de sécurité... En fin de compte, un ensemble de normes doivent être respectées. ces normes sont utilisées dans les opérations Y a-t-il des restrictions sur la plateforme ? Cela fonctionnera-t-il sur la plateforme d'exploitation ? Si les normes d'exploitation ne correspondent pas du tout à votre plateforme, alors ce n'est qu'une décoration ?
La première chose à faire en matière d'intelligence est l'analyse des logs. Lorsqu'il existe de plus en plus de types d'appareils, l'analyse des logs devient de plus en plus importante. À partir de ce niveau, nous utilisons également la plate-forme d'analyse de journaux de big data IVORY auto-développée, qui adopte le cadre sous-jacent du big data et un algorithme de coupe breveté exclusif par glisser-déposer pour agréger des journaux massifs en temps réel, rechercher avec précision les journaux statistiques et analyser intelligemment le contenu des journaux, simplement par l'analyse et l'exploration de données volumineuses, peut être réalisé avec des opérations simples.
De plus, créer un produit d'exploitation et de maintenance sans expérience en matière d'exploitation et de maintenance n'est en réalité qu'un cadre. Pour véritablement atteindre l'intelligence, les outils seuls ne suffisent pas. Vous devez également combiner des scénarios d'exploitation et de maintenance réels, optimiser la valeur des données et piloter les opérations. avec intelligence. Capacités dimensionnelles, et finalement parvenir à une méthode de résolution de problèmes en boucle fermée, de la découverte à l'analyse décisionnelle jusqu'à la résolution de problèmes.
Le premier est notre cadre global de solution d'exploitation et de maintenance agile pour l'ensemble du site, avec « la visualisation, l'automatisation et l'intelligence » comme cœur de la solution agile d'exploitation et de maintenance full-stack : grâce à la « visualisation d'exploitation et de maintenance », nous pouvons réaliser un fonctionnement transparent à tout moment, en tout lieu et sur l'ensemble du réseau. La valeur de l'exploitation et de la maintenance est présentée ; l'efficacité et la qualité des services d'exploitation et de maintenance sont globalement améliorées grâce à « l'automatisation de l'exploitation et de la maintenance » ; "intelligence d'exploitation et de maintenance". Dans ce processus, nous mettons en œuvre une construction en couches via l'exploitation et la maintenance pour résoudre les problèmes à différents niveaux. C'est ce que je partage aujourd'hui, merci à tous !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!