Dans le premier numéro, le patron de Yangjingjing a exprimé de nombreuses opinions intéressantes. Certaines personnes ont laissé un message disant qu'il s'agissait d'un guide pour dissuader l'exploitation et la maintenance Haha, les opinions des invités à ce sujet. Le problème sera différent. Veuillez rester avec moi. Gardez l’esprit ouvert, écoutez les opinions de centaines d’écoles de pensée et faites vos propres projets de carrière et de vie. Comme le dit le proverbe, si vous écoutez les deux, vous serez éclairé, mais si vous croyez seulement, vous serez sombre. Si vous n'écoutez que ce qui convient à vos oreilles, il y a de fortes chances qu'il n'y ait pas d'approfondissement. réflexion et collision, ce qui est dommage.
C'est le deuxième numéro du "Forum Exploitation et Maintenance", terre-à-terre et de haut niveau, commençons !
Présentation de l'invité
Dans ce numéro, nous invitons Nie An, le responsable de l'exploitation et de la maintenance de Zuoyebang, un vétéran de l'industrie. Il a travaillé chez Alibaba, Xiaomi, Didi et Zuoyebang. 10 ans d’expérience en exploitation/R&D/gestion.
Brève description des points clés
- L'exploitation et la maintenance traditionnelles sont chargées d'assembler les produits industriels en services, de les livrer aux utilisateurs et de maintenir les opérations de service. Elles se caractérisent par une forte dépendance à l'égard des entreprises
- Crise sur le terrain et l'utilisation intensive des cloud publics à l'ère du cloud natif, l'architecture des microservices et DevOps ont été véritablement réalisées, le système d'outils continue de prospérer et les responsabilités traditionnelles d'exploitation et de maintenance sont constamment externalisées, transférées et remplacées, et une crise de domaine est apparue
- La structure organisationnelle et la méthode de collaboration sont progressivement passées de la collaboration de tous à la plateforme en libre-service. Le thème principal de la maintenance est passé de la collaboration horizontale aux produits de service et à la plateforme intermédiaire technologique
- Transformation de l'exploitation et de la maintenance techniquement. plate-forme de service, des capacités de service d'exploitation et de maintenance externes OPaS (OP as Service) sont fournies, qui sont divisées en deux couches : objet et scène ; la couche inférieure Lorsque les objets sont maintenus de manière isomorphe, une architecture d'exploitation et de maintenance durable est formée
- Opération commerciale et la maintenance. Le cœur de la transformation orientée services est la reconnaissance des rôles. Le personnel d'exploitation et de maintenance doit s'adapter du rôle opérationnel qui dépend de l'entreprise à celui de fournisseur de services d'exploitation et de maintenance indépendant dans une perspective d'hyperservice, d'exploitation et de maintenance ; a un grand potentiel
- L'exploitation et la maintenance des composants, le contrôle des composants eux-mêmes, vont plus loin que la pure gestion de l'exploitation et de la maintenance et suivent le modèle de l'oignon, c'est-à-dire basé sur la plate-forme de livraison, de construction et de gestion des ressources, puis approfondissez le domaine professionnel du composant lui-même
- Développement d'exploitation et de maintenance, décoller le travail d'itération répétitif de la plate-forme, se concentrer sur le centre public d'exploitation et de maintenance, faire une technologie professionnelle et un effet de levier élevé
Étape d'exploitation et de maintenance
Exploitation et maintenance d'Internet, Il est passé par plusieurs étapes, notamment le travail manuel pur, la standardisation, la plateforme et l'intelligence numérique, comme le montre la figure ci-dessous. Parmi eux, DevOps est un changement organisationnel axé sur la technologie et un changement non professionnel.
De l'historique de développement de l'exploitation et de la maintenance, nous pouvons voir plusieurs caractéristiques :
- Héritage. La nouvelle étape hérite et perpétue souvent l'excellente expérience de l'ancienne étape et innove dans les concepts, les technologies et les organisations
- Par exemple, la plateforme hérite et renforce les résultats de l'étape de standardisation, et l'intelligence numérique hérite des résultats de platformisation. , tout en introduisant la technologie du big data
- Transfert de responsabilité. DevOps est un tournant dans le modèle de gestion de l'exploitation et de la maintenance. Opérations et maintenance après DevOps
- D'une part, continuer à progresser dans la direction de la spécialisation en exploitation et maintenance et maintenir la capacité de gérer l'isomorphisme pour l'exploitation et la maintenance de niveau supérieur. objets
- D'autre part, il met l'accent sur l'intégration de l'exploitation et de la maintenance, de la R&D, et les responsabilités d'exploitation et de maintenance sont progressivement transférées à la recherche et au développement des entreprises
Apprendre l'histoire du développement d'un certain domaine permet nous d'apprendre de l'histoire et de profiter de la tendance.
Exploitation et maintenance traditionnelles
Dans le modèle d'exploitation et de maintenance traditionnel, les objets de service peuvent essentiellement être divisés en trois couches. La couche la plus basse est l'infrastructure matérielle IaaS, qui est principalement composée d'informatique, de réseau et de stockage ; la couche intermédiaire est l'infrastructure logicielle, y compris les systèmes d'exploitation, la technologie de virtualisation, les cadres de code, les middlewares, etc. ; couche, principalement les services d'application.
La responsabilité de l'exploitation et de la maintenance traditionnelles est de assembler des produits industriels en services, de les fournir aux utilisateurs et de maintenir les opérations de service grâce à une série de processus, de technologies et de méthodes généralement nécessaires pour atteindre la stabilité et la stabilité. coût, sécurité, efficacité et autres objectifs multidimensionnels (opérationnels). Dans une certaine mesure, l'exploitation et la maintenance traditionnelles doivent dépendre de l'entreprise pour générer de la valeur. De nombreuses entreprises se demanderont si elles comprennent l'activité comme l'une des principales évaluations des travailleurs de l'exploitation et de la maintenance (dépendance). Avec la popularisation du cloud computing et de la technologie cloud native, le modèle traditionnel d'exploitation et de maintenance a rencontré de nombreux défis. Par exemple,
- Une fois que les entreprises utilisent le cloud public, IaaS/PaaS et même SaaS sont essentiellement orientés services et peuvent être obtenus via l'API ; une grande partie des travaux de construction d'exploitation et de maintenance est réalisée avec l'aide de fournisseurs de cloud, tels que le matériel, les systèmes, réseaux, bases de données et big data, etc. L'usine d'origine n'a besoin de conserver qu'une petite quantité de capacités de sélection professionnelle et d'intégration (externalisation)
- Après la vulgarisation de la technologie cloud native, l'architecture des microservices et le DevOps ont été réalisés à grande échelle, et les opérations précédemment réalisées par du personnel professionnel d'exploitation et de maintenance seront progressivement confiées à la recherche et au développement des entreprises. Achèvement en libre-service, tel que la livraison, le changement, la surveillance, la capacité, etc., les responsabilités d'exploitation et de maintenance sont largement transférées à la recherche et au développement des entreprises. (transfert)
- L'effet d'agrégation professionnelle du cloud public et du système open source cloud natif offre une amélioration continue des perspectives d'outillage . Une fois que l'outillage améliore l'efficacité, moins de main d'œuvre est nécessaire pour le même poste ; l'outillage accumule des capacités professionnelles et le seuil technique pour les opérateurs devient de plus en plus bas ; une fois que les outils ont évolué vers l'automatisation et l'intelligence, les machines peuvent remplacer la main d'œuvre. Le remplacement de la main-d'œuvre par des plates-formes s'approfondit encore progressivement (remplacement)
Comme mentionné ci-dessus, une fois l'infrastructure externalisée vers le cloud public et le cloud natif, les responsabilités d'exploitation et de maintenance sont transférées à la recherche et au développement des entreprises, et la plate-forme remplace le professionnalisme de travail. Face à de telles tendances et faits, les praticiens de l’exploitation et de la maintenance doivent procéder à certaines transformations.
Structure organisationnelle
Tout d’abord, parlons de la structure organisationnelle. À long terme, la forme organisationnelle d'une entreprise à l'ère du cloud natif comprendra les éléments suivants :
Les principaux utilisateurs finaux sont les clients du groupe A de l'entreprise et les groupes à but lucratif potentiels. L'équipe commerciale est responsable des utilisateurs finaux et ses rôles incluent le produit, l'entreprise, le marketing, le marketing, etc. La recherche et le développement commerciaux sont directement au service de l'équipe commerciale, en fournissant principalement des applications/services SaaS. La recherche et le développement de plates-formes servent la recherche et le développement des entreprises, fournissent diverses fonctionnalités PaaS et encapsulent les fournisseurs de cloud. Il y aura également des organisations transversales, comme les coûts d'exploitation FinOps, l'efficacité des opérations EP, l'équipe administrative informatique, etc.
Dans la nouvelle structure organisationnelle, l’objectif ultime de chacun est d’accomplir ses propres tâches et de bien servir les utilisateurs finaux. L'équipe commerciale accorde plus d'attention à la valeur commerciale et le système R&D se concentre sur la qualité du service. Avec les progrès des technologies de l'information, les fonctions actuellement exercées par les organisations interfonctionnelles seront progressivement décomposées en équipes de R&D de plate-forme, et la principale méthode de collaboration organisationnelle passera de la collaboration de tous au libre-service de la plate-forme. Les opérations et la maintenance ont de nouveaux objectifs de travail, à savoir : Le thème principal de l'exploitation et de la maintenance est la plate-forme de gestion, le centre de ressources et de technologie, et non la collaboration horizontale. Les opérations et la maintenance doivent être un levier de haute technologie, responsabiliser les entreprises et aider les entreprises à améliorer leurs opérations. efficacité.
Architecture technique
Transformation de l'exploitation et de la maintenance, l'objectif est de fournir des services de gestion de l'exploitation et de la maintenance aux équipes de niveau supérieur via une plateforme en libre-service l'essence est l'OPaS d'exploitation et de maintenance (OP as Service) ; . Selon les différences de contenu, les travaux d'exploitation et de maintenance peuvent être divisés en deux catégories : la gestion des objets et la gestion des scènes, comme le montre la figure ci-dessous.
La gestion d'objets est un modèle vertical qui s'articule autour de l'exploitation et de la maintenance des objets et de la construction d'une plateforme de gestion du cycle de vie. Les objets d'exploitation et de maintenance peuvent être classés selon les ressources IaaS (machine, réseau, stockage, services cloud), les composants PaaS (base de données, cache, MQ, passerelle), les applications SaaS (business middle platform, applications métiers), le framework de services (runtime, Cadre de code, service de noms) et d'autres dimensions, la granularité de classification des différentes entreprises est différente. Chaque type d'objet dispose d'une plateforme de gestion indépendante (cheminée). Les fonctions de la plateforme de gestion doivent couvrir le cycle de vie complet de l'objet d'exploitation et de maintenance. Les étapes clés incluent la modélisation (métadonnées), la livraison/changement, le suivi/mesure, le hors ligne. , etc., qui sont différentes de celles des objets publics, les fonctions de gestion du Cloud sont similaires. L'objectif de la gestion d'objets est de produire des produits cloud verticalement complets et de créer une plate-forme cloud interne ICSP.
La gestion des scénarios est un mode horizontal qui gère les étapes du cycle de vie de divers objets d'exploitation et de maintenance en fonction de scénarios d'exploitation et de maintenance. La classification des scénarios d'exploitation et de maintenance, y compris la livraison/changement, la surveillance/mesure, le multi-cloud, les coûts, etc., est très proche des habitudes de travail de la recherche et du développement des entreprises, couvre quelques scénarios à haute fréquence et est similaire dans différentes entreprises. Chaque type de scénario d'exploitation et de maintenance dispose d'une plateforme de gestion de scénario indépendante, telle qu'un centre d'ordres de travail, un centre de données, une plateforme FinOps, etc. La gestion des scénarios s'appuie sur la gestion des objets. La plateforme de gestion des scénarios gère les objets d'exploitation et de maintenance en unifiant les modèles, en agrégeant les données, en orchestrant les API de gestion et de contrôle, etc. L'objectif de la gestion de scène est de fournir des capacités de gestion d'entreprise en libre-service et de créer une plate-forme de développement interne IDP.
Les moyens courants de générer des objets d'exploitation et de maintenance incluent l'auto-recherche, la construction open source, l'approvisionnement externe (cloud public), etc. Chaque objet d'exploitation et de maintenance peut être subdivisé en différentes catégories, clusters, instances, etc., avec une ampleur et une complexité sans précédent. Ce n'est qu'en maintenant l'isomorphisme des caractéristiques de gestion des objets d'exploitation et de maintenance que nous pouvons construire et maintenir des services d'exploitation et de maintenance à grande échelle et à faible coût, réalisant ainsi une exploitation et une maintenance à grande échelle (effet de levier technique donc l'isomorphisme). des objets d'exploitation et de maintenance constitue la base de l'ensemble de l'architecture d'exploitation et de maintenance.
Maintenance isomorphe
La maintenance isomorphe vise les caractéristiques de gestion des objets d'exploitation et de maintenance, pas toutes les caractéristiques. La méthode de maintien de l'isomorphisme est la suivante : contrôler l'incrément, réparer l'inventaire et empêcher la fission. Comme le montre la figure ci-dessous, la plate-forme est utilisée pour fournir des incréments de demande et de contrôle, piloter la gouvernance grâce à des mesures pour réparer les stocks et empêcher une fission à grande échelle du système technique grâce à des cadres de services standardisés et des mesures qui suivent strictement les spécifications et les spécifications ; nécessitent également des mesures ou la saisie de questions sur la plateforme pour s'améliorer, les trois se complètent. Les spécifications sont divisées en spécifications de service (correspondant à la gouvernance des services), spécifications de gestion (correspondant au contrôle d'exploitation et de maintenance) et autres types.
La maintenance isomorphe repose sur une division organisationnelle du travail avec des responsabilités principales claires. Par exemple, l'exploitation et la maintenance se concentrent sur la gestion, en supprimant les outils commerciaux et en les renvoyant à la R&D commerciale, tels que la gouvernance du statu quo, la réponse aux alarmes et le CD. La R&D commerciale se concentre sur la mise en œuvre commerciale, en supprimant la logique non commerciale du service ; cadre et le confier à l'infrastructure. La mise en œuvre, telle que la découverte de services et le contrôle du trafic ; l'infrastructure se concentre sur les capacités de milieu de gamme telles que le cadre de service, en supprimant les fonctions de gestion et en les confiant à l'exploitation et à la maintenance, telles que la fourniture de la demande, changer de contrôle, etc. L'influence de la culture ne peut être ignorée. Les opérations et l'architecture généreront des concepts et cultiveront les habitudes des utilisateurs grâce à la communication et aux conseils, par exemple en ne fournissant pas d'engagements SLA pour les besoins personnalisés et en fournissant des capacités d'observation prêtes à l'emploi pour les applications standard.
Basé sur la maintenance isomorphe des objets d'exploitation et de maintenance, le support ascendant du système technologique orienté services d'exploitation et de maintenance a formé une architecture d'exploitation et de maintenance durable, comme indiqué ci-dessous. Au niveau technique actuel, les services d'exploitation et de maintenance basés sur des plates-formes en libre-service peuvent résoudre 70 % des besoins, et les 30 % restants nécessitent encore du travail manuel, comme la communication de la demande, le dépannage, l'acceptation des résultats, la conformité aux politiques, etc. Avec l’avancement de la technologie et des concepts, on estime que la proportion des services d’exploitation et de maintenance va encore augmenter.
Remarque : Le cadre de service présenté dans cet article comprend non seulement le cadre de code et la bibliothèque de codes d'il y a N ans, mais également la gouvernance, l'étape de transition et la dénomination populaires actuelles des microservices.
Pratique de transformation
Opération et maintenance en tant que service OPaS
L'exploitation et la maintenance d'entreprise, également appelées exploitation et maintenance d'applications par certains, sont les plus proches du cloud natif et les plus touchées. En plus des responsabilités traditionnelles entre équipes telles que la formulation des spécifications, la construction des processus et la gestion globale, les opérations commerciales et la maintenance doivent être transformées dans une direction orientée service :
- Premièrement, la perception du rôle doit changer. Passez d'un rôle opérationnel qui s'appuie sur l'entreprise pour générer de la valeur à un rôle de fournisseur de services d'exploitation et de maintenance avec une valeur indépendante. Le changement de rôle est la clé
- Sur le plan organisationnel, redistribuez les principales responsabilités. Business R&D est la principale partie responsable de l'application, et l'exploitation et la maintenance ne sont pas la principale partie responsable de l'application, ni une nounou de plug-in, mais le fournisseur de capacités de gestion pour l'application utilise l'exploitation et la maintenance. entretient et complète le travail d'opération par lui-même
- En termes de mécanisme, l'évaluation est un système reconstruit. La performance des postes d'exploitation et de maintenance des entreprises n'est plus fortement liée à l'équipe commerciale et à la recherche et au développement de l'entreprise, mais davantage axée sur l'exploitation et la maintenance axées sur les services, avec moins d'accent sur l'évaluation subjective et davantage sur l'évaluation technique. la transformation de l’exploitation et de la maintenance se déroule en quatre étapes. Clarifier l'objet--> Points communs abstraits--> Construire la plate-forme--> L'objet de la réalisation d'une exploitation et d'une maintenance à grande échelle
est d'abord l'application (également appelée service), puis l'étendue scénario de l'application (tel que la perspective commerciale, la perspective globale de l'entreprise)
- Le point commun abstrait est la difficulté et le point clé. Il existe un grand nombre d'applications, des piles technologiques complexes et de nombreuses fonctionnalités personnalisées. Il est nécessaire de faire abstraction des caractéristiques communes de gestion des applications pour éviter de tomber dans des cas personnalisés. À proprement parler, les caractéristiques communes des applications sont les objets de gestion de l'exploitation et de la maintenance
- La plate-forme de construction fait référence à la plate-forme de gestion des applications, et l'exploitation et la maintenance à grande échelle sont un état final durable
- Troisièmement, les objets d'application restent isomorphes. En plus du renforcement des capacités orientées services, l'énergie principale du personnel d'exploitation et de maintenance doit être investie dans la maintenance des isomorphismes en tant que service OPaS (OP as Service) est l'objectif proposé du point de vue de l'exploitation et de la maintenance des entreprises au milieu. -terme de notre transformation. Il est souligné que l'orientation générale, mais le manque de chemins, était relativement abstraite plus tard, OPaS a été progressivement affiné en une architecture d'exploitation et de maintenance ICSP+IDP, et son champ d'application a été étendu au secteur ; toute l’équipe d’exploitation et de maintenance, afin qu’il y ait un chemin et un point de départ clairs.
Perspective hyper-service (exploitation et maintenance de l'entreprise)
En plus de la servitisation, l'exploitation et la maintenance de l'entreprise peuvent également conduire à la construction d'une perspective hyper-service (désormais renommée scénario). Le puzzle technologique DevOps sous le cloud natif n'est pas complet. Seule la partie application + informatique est terminée, et il existe des lacunes dans les capacités dans d'autres directions, en particulier la perspective ascendante de l'entreprise, la perspective du département, la perspective de l'entreprise, etc. perspective hyper-service. Dans une perspective d'hyperservice, le personnel de R&D des entreprises n'a généralement pas la capacité ou la motivation pour prendre les devants ; les chefs de département ou les architectes peuvent s'occuper de leurs propres départements, mais sont limités par leurs responsabilités professionnelles et ont du mal à se développer. situation globale. D'un autre côté, la perspective de l'hyperservice est l'ancien champ de bataille de l'exploitation et de la maintenance des entreprises traditionnelles, avec une expérience, une compréhension et des avantages cognitifs sans précédent. L'exploitation et la maintenance des entreprises conduisent à la construction d'une perspective d'hyperservice, qui peut non seulement combler les lacunes dans le domaine du cloud natif, mais également faire jouer pleinement les avantages professionnels de l'exploitation et de la maintenance des entreprises et tirer parti des opportunités de transformation. Ce sera un choix gagnant-gagnant, comme indiqué ci-dessous.
Perspective de super service, incluant mais sans s'y limiter :
- Livraison des exigences : centre de bons de travail, moteur d'orchestration, moteur d'exécution
- Contrôle des modifications : cinq règles fourre-tout, gestion et contrôle centralisés, approbation de l'orchestration , approbation de l'exécution, métriques de vérification et de modification du service
- Métriques d'observation : regroupez et affichez les données d'observation et de mesure d'un point de vue commercial, en prenant en charge l'exploration jusqu'à la granularité des applications
- Architecture multi-cloud : mesure, gouvernance, plans et exercices tout au long du processus. l'ensemble du système technique
- Contrôle des coûts : Toute l'informatique de l'entreprise La facturation, l'allocation, la gestion et le contrôle ainsi que l'optimisation des ressources sont formulées de manière indépendante pour la direction FinOps
- : l'établissement des spécifications d'exploitation et de maintenance du point de vue global de l'entreprise, et la supervision de mise en œuvre de processus pour éviter la construction répétée de cheminées de petites équipes
- etc.
sous cloud natif En regardant le puzzle technologique DevOps, il existe des lacunes dans les capacités. Par exemple, la prise en charge des services de base tels que CDN, object. le stockage, MQ et EMR ne sont pas parfaits, et ils sont encore en période exploratoire en 2022 du point de vue de la gestion de l'exploitation et de la maintenance, tant qu'ils sont couverts par le cadre de service (Authentification, découverte, communication, perception, flux) ; contrôle) est rayonné, même s'il est géré par Cloud Native.
Modèle Onion (services cloud, middleware, exploitation et maintenance du big data)
Services cloud, middleware, big data et autres objets d'exploitation et de maintenance, la pile technologique est convergée et axée sur les professionnels. Lors de la mise en œuvre de la transformation du personnel d’exploitation et de maintenance, ils peuvent suivre le modèle de l’oignon.
- La première phase est basée sur la fourniture de ressources, transformant les objets d'exploitation et de maintenance d'origine en entités de ressources, fournissant des fonctions de service garanties en amont et établissant le résultat net de la valeur du travail
- La deuxième phase est investissement Faites de gros efforts pour construire une plateforme de gestion pour gérer le cycle de vie des entités de ressources et vous libérer. La plateforme doit être capable de mettre en libre-service la ToC et de réaliser le découplage
- La troisième étape approfondit les domaines professionnels des composants eux-mêmes, de l'architecture, du code, des performances, Améliorer le professionnalisme dans tous les aspects tels que l'exploitation et la maintenance. Une fois cette étape franchie, l'exploitation et la maintenance sont devenues des experts en services dans ce domaine, et non seulement des administrateurs. Le modèle oignon a d'abord été vérifié dans les bases de données, les mégadonnées, les middlewares et d'autres postes, puis utilisé dans le service cloud. a également été couronnée de succès. Par exemple, l'équipe CloudOps d'exploitation et de maintenance des services cloud de notre entreprise met en œuvre la transformation selon le modèle oignon. Les détails sont les suivants :
Cette équipe cible divers services cloud, répartis entre plusieurs fournisseurs de cloud tels que Tencent, Alibaba et Baidu.
Il y a deux ans, nous avons fourni des machines, du stockage et d'autres ressources en externe via diverses méthodes manuelles pour soutenir le développement rapide de l'entreprise (livraison de ressources)- Après cela, nous avons commencé à construire une plateforme de gestion multi-cloud pour gérer les machines, bande passante, stockage d'objets, cycle de vie des services cloud tels que CDN. Au cours de ce processus, la plate-forme de gestion CloudOps a été transformée avec succès en fournisseur de services cloud secondaire interne de l'entreprise ICSP (capacité de la plate-forme)
- Ensuite, nous continuerons à renforcer l'apprentissage, la reconnaissance, la sélection et l'évolution des produits de cloud public Promouvoir et ainsi de suite , efforcez-vous d'établir plus de professionnalisme dans ce domaine (composant lui-même)
-
- Plate-forme intermédiaire d'exploitation et de maintenance (développement de l'exploitation et de la maintenance)
Avec l'exploitation et la maintenance de l'entreprise, l'exploitation et la maintenance des composants, l'exploitation et la maintenance du système (service cloud de réseau de ressources) et d'autres rôles ont commencé à participer au travail de développement, et l'espace laissé à l'équipe DevOps de développement d'exploitation et de maintenance est progressivement devenu de moins en moins, et la division du travail n'était pas claire pendant le processus de transformation. En référence à la prévision de la mise à niveau de la structure organisationnelle et de l'architecture technique, nous avons réajusté le positionnement d'OpDev : OpDev ne doit pas être une externalisation du développement ou un vassal du personnel d'exploitation et de maintenance, mais doit disposer de ses propres services indépendants. En conséquence, la plate-forme d'exploitation et de maintenance d'origine a été divisée en deux parties. Une partie axée sur l'itération fonctionnelle et ne pouvait pas être réutilisée, et a été laissée aux utilisateurs d'origine pour s'en occuper eux-mêmes, comme la console de ressources IDP, les outils de gestion de scénarios ICSP, etc. ; l'autre partie était constituée de fonctions publiques, abstraites car la plate-forme intermédiaire d'exploitation et de maintenance est responsable d'OpDev, telles que l'IAM de compte unifié, le moteur d'orchestration des ordres de travail, le collecteur d'indicateurs de surveillance, etc., comme indiqué ci-dessous.
La plate-forme intermédiaire d'exploitation et de maintenance est un sous-ensemble de la plate-forme d'exploitation et de maintenance d'origine. Elle n'a pas besoin de reconstruire les connaissances du domaine et a des exigences de qualité de code relativement élevées (les mêmes que celles de base). composants). C’est exactement ce que OpDev Les points forts des chaussures pour enfants. À mesure que les responsabilités sont centralisées et réduites, OpDev doit simultanément se réduire et obtenir un effet de levier plus important.
Quelques leçons
Permettez-moi de partager brièvement certaines des leçons de transformation de notre entreprise, notamment
- Il devrait y avoir un compromis entre la transformation et conservatisme. La transformation de l'exploitation et de la maintenance traditionnelles en prestataire de services ne se fera pas du jour au lendemain, et tous les employés ne migreront pas non plus. Il y aura toujours quelqu'un qui restera sur place (le niveau technique actuel est d'environ 73 %). Une fois les ressources concentrées, le personnel back-end recevra davantage de retours de valeur
- Gradient de différenciation des capacités de R&D. La capacité de passer de l'exploitation et de la maintenance au développement est inégale. Elle doit partir de l'itération des besoins de l'entreprise, contrôler strictement la conception et l'acceptation pour garantir la qualité, compléter consciemment la théorie de l'ingénierie et être équipée d'un excellent milieu de gamme d'exploitation et de maintenance. capacités pour garantir Une couche inférieure propre
- plate-forme n'est pas la seule option. La plateforme est le moyen le plus puissant de mettre en œuvre des capacités de service, mais ce n’est certainement pas le seul. L'organisation, la culture, les normes, les processus et les plateformes sont tous indispensables (mais le coût de transfert peut être légèrement plus élevé)
- Effacer les objets de gestion de l'exploitation et de la maintenance. En matière d'exploitation et de maintenance, en particulier d'exploitation et de maintenance des applications, l'objet de gestion n'est pas l'application elle-même, mais les caractéristiques communes de l'application, plus la valeur de l'exploitation et de la maintenance de l'application (effet de levier) est grande ; 🎜#
Garantie organisationnelle On ne peut l'ignorer. La structure organisationnelle est la principale force productive. Le CTO doit faire la différence, avoir des objectifs clairs et avoir une division du travail claire, comme la clarification des principales responsabilités, la mise en place d'agences d'acceptation indépendantes, des cycles de mesure et de gouvernance, etc. garantie organisationnelle pour la transformation de l'exploitation et de la maintenance- #🎜🎜 #Méfiez-vous de la réflexion pure projet. Les opérations et la maintenance doivent encore participer à certains projets pour faire exploser la valeur et acquérir un sentiment d'accomplissement à court terme, mais il est également facile pour les gens de perdre leur sang-froid et de ramener la valeur à zéro, cela nécessite des objectifs de conception conscients et une accumulation de services ; capacités pendant le processus du projet
# 🎜🎜#La prévention est plus efficace que l'intervention d'urgence. Les problèmes de stabilité doivent être résolus dans le domaine architectural, et la prévention est plus efficace que l'intervention d'urgence. Donnez la priorité à l'extension du MTBF, puis au raccourcissement du MTTR-
- Ce qui suit est un contenu supplémentaire, et non le cœur de cet article.
Évolution de la fourniture à la demande Qu'il s'agisse d'un cloud public ou d'une plateforme K8S interne, il existe un grand nombre d'opérations de livraison à la demande. Ce type de plateforme de livraison ToM (ToManager) manque souvent des contraintes nécessaires et ne peut être ouvert qu'à des personnes expérimentées. Afin d'optimiser la division du travail et d'améliorer l'efficacité, la surface de gestion de l'exploitation et de la maintenance ToC (ToRD) peut être intégrée à la gestion de l'exploitation et de la maintenance grâce à la méthode « arrangement des ordres de travail + approbation » Le flux de travail/ordre de travail lui-même sera fortement intégré à la gestion de l'exploitation et de la maintenance. Les meilleures pratiques pourront être ouvertes en toute sécurité à la R&D. Il s’agit d’une direction importante pour la servitisation des capacités d’exploitation et de maintenance. Le chemin d'évolution de la livraison en libre-service est le suivant :
À l'heure actuelle, la communication relie les exigences aux aspects techniques. Les solutions sont relativement nombreuses. Celles qui sont difficiles à mettre en libre-service ou à automatiser nécessiteront davantage de tentatives à l'avenir.
Point marginal de l'exploitation et de la maintenance à l'échelleL'essence de l'économie de l'exploitation et de la maintenance à l'échelle est le coût marginal, qui est « le coût marginal décroissant de la gestion de l'exploitation et de la maintenance par rapport au "coût marginal croissant de l'interaction de maintenance isomorphe". Comme le montre la figure ci-dessous, lorsque le nombre d'objets d'exploitation et de maintenance est faible, les coûts de gestion d'exploitation et de maintenance représentent la majorité, comme la construction de plates-formes et les opérations manuelles lorsque le nombre d'objets d'exploitation et de maintenance augmente, la maintenance isomorphe ; constitue le coût principal ; le tournant marginal sera affecté par la technologie, les concepts et d’autres facteurs environnementaux.
La technologie cloud native réduit la difficulté de maintenir l'isomorphisme (favorisant le déplacement de la courbe de maintenance de l'isomorphisme vers la droite) et améliore les capacités orientées vers les services d'exploitation et de maintenance (favorisant le déplacement vers le bas de la courbe de gestion de l'exploitation et de la maintenance) permettant au personnel d'exploitation et de maintenance de gérer davantage d'objets d'exploitation et de maintenance à moindre coût, améliorant ainsi considérablement l'efficacité de la production.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!