ホームページ >運用・保守 >安全性 >10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。

10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。

PHPz
PHPz転載
2023-06-09 21:53:11982ブラウズ

昔、コンピュータサイエンスを専攻していた新卒の頃、求人サイトでたくさんの求人情報を閲覧していたのですが、研究開発エンジニア、運用保守エンジニア、テストエンジニアというまぶしい技術職に戸惑いました。 .‍

大学時代、私の専門課程はまあまあで、技術的なビジョンを持たず、どの技術的な方向性を追求すべきかについて明確なアイデアがありませんでした。

先輩が私にこう言うまでは、「運用保守をしなさい。運用保守をするのに毎日コードを書く必要はありません。Liunx をプレイできれば十分です。やるよりずっと簡単です。」

‍‍‍‍‍‍‍‍私は、「信じます...」を選択しました...

私はこの業界に 10 年以上携わっています。私は多くの苦しみ、多くの責任を負い、サーバーを停止させ、部門の人員削減も経験済みです 今、シンプルな開発より運用保守がやりたいと言われたら迷わずブロックします...‍‍‍‍‍‍

基本的な運用保守業務は非常に単純ですが、運用保守作業の最大の特徴は複雑であるということです

私の意見では、運用保守作業は最も複雑な技術的な仕事の 1 つであり、多くの技術的な詳細を処理する必要があります。さまざまなプラットフォームの統合と構成、およびさまざまな複雑な問題や障害の解決。したがって、運用および保守担当者は、変化する技術的ニーズおよびビジネス ニーズに対応するための幅広いスキルと知識を持っていることが求められます。

運用および保守では、多くの場合、複雑なプラットフォームの運用および保守作業に直面します。その理由は、企業が通常管理および監視する必要があるのは、単一のプラットフォームやシステムではなく、はるかに複雑であるためです。これらのシステムは、さまざまなベンダーから提供され、サーバー、ストレージ、ネットワーク、アプリケーションなど、さまざまなプロトコルやテクノロジを使用している可能性があります。

複雑な構成管理も運用保守作業の難しさのひとつです。構成管理には、システムのインストール、構成の更新、ソフトウェアのインストールと更新など、多数のタスクが含まれます。これらのタスクは、システム全体で調整して実行する必要があります。

大規模クラスターの管理も簡単ではありません。大企業は数千台のサーバーを管理する必要があり、これには強力なツールと自動化テクノロジーが必要です。運用スタッフは、構成、更新、監視、レポートを管理するための自動ツールを必要としています。

運用保守のセキュリティ問題も無視できません。運用および保守担当者は、企業の資産とデータを保護し、システムのセキュリティを確保する必要があります。これには、ファイアウォール、侵入検知システム、セキュリティ パッチ管理などが含まれる場合があります。

運用と保守には、豊富なトラブルシューティングの経験も必要です。運用保守業務において障害はよくある問題であり、システムに問題が発生した場合、運用保守担当者は迅速に障害箇所を特定し、サービスを復旧するための措置を講じる必要があります。

継続的な学習は、運用保守担当者にとって最も基本的な要件です。運用および保守のツールとテクノロジーの急速な進化は誇張されていますが、IT テクノロジーは常に発展しており、新しいテクノロジーやツールが常に登場しており、運用および保守担当者はテクノロジーの急速な進化に対応するために知識を常に学習し、更新する必要があります。

運用保守はリスクの高い職業です。サーバーを一度も停止したことがない運用保守の人生は完璧ではありませんか?

リスクの高い職種といえば、運用保守業務が挙げられますが、多くの大企業においても運用保守業務の手作業によるダウンタイム事故が多発しています。パシフィック石油会社サイバー攻撃 (2021 年): 2021 年 5 月、米国パシフィック石油会社はランサムウェア攻撃を受け、同社のネットワークとサーバーが誤動作してシャットダウンされました。報道によると、この事件は従業員が誤って悪意のあるリンクを開いたことが原因で発生したという。

GitLab の停止 (2017 年): 2017 年 1 月、コード ホスティング サービス プロバイダーの GitLab で重大なデータ損失インシデントが発生し、多くの顧客のデータが完全に削除されました。その後の GitLab の公式声明によると、これは従業員が実稼働データベース内のファイルを誤って削除したことが原因でした。

ウォルマートのサーバー障害 (2019 年): 2019 年 11 月、アメリカの小売大手ウォルマートのサーバーが 1 時間以内に複数回ダウンし、同社の Web サイト、アプリケーション、支払いシステムが正常に動作しなくなりました。このインシデントは、従業員が定期的にサーバーのメンテナンスを行っている際に犯したミスが原因で発生したと伝えられています。

Microsoft Azure クラウド サービスの停止 (2020 年): 2020 年 9 月に、Microsoft の Azure クラウド サービスが世界的な停止に見舞われ、多くの顧客のアプリケーションとサービスが適切に動作しなくなりました。その後、このインシデントはネットワーク構成エラーによるものであることが確認されました。

運営と保守は、自然災害など、さまざまな不可抗力に直面する可能性もあります。

フィリピン台風 (2013 年): 2013 年 11 月、フィリピンは最強の台風に遭遇しました。 1947年以来フィリピンを襲った台風。台風は6,000人以上の死者・行方不明者を出し、国のインフラに大損害を与えた。この災害により、多くの国際企業がフィリピンにあるデータセンターとサーバーの停止も引き起こされました。

米国ハリケーン (2012 年): 2012 年 10 月、米国東海岸は激しいハリケーンに遭遇し、大規模な停電、通信障害、洪水が発生しました。この災害により、Amazon、Google、Netflix などの一部の有名企業やサービスプロバイダーでもデータセンターとサーバーの停止が発生しました。

キャリア開発の方向性が不明確で、運用保守作業が現場で混乱に陥ることもよくあります...‍‍‍‍‍

ハードスキルの不足が最大の問題かもしれません運用と保守の担当者が直面します。テクノロジーが進化し続けるにつれて、運用とメンテナンスの作業では、変化する市場の需要に適応するために新しいスキルとツールを継続的に学習する必要があります。しかし、何年も運用と保守の仕事をしてきた人の中には、自分のスキルが市場の需要に遅れていることに気づき、混乱し圧倒されてしまうことがあります。

劣悪な環境は実際には運用保守によって引き起こされるものではありません。他の技術分野に比べて、運用保守分野のキャリア形成の道筋は比較的曖昧です。組織によっては、運用保守エンジニアは「物流部門」としてのみ認識されており、正当な評価や報酬が得られないなど、他の技術チームと同等の地位や待遇が得られていないことがあります。このことは、運転保守に対する否定的な感情を悪化させ、運転保守技術者のキャリア開発の見通しについてある程度不明確になる原因となっています。

空を見上げる暇もなく、ただうつむいて歩いています。運用保守業務の本質はシステムの安定性と信頼性を確保することであり、運用保守技術者は常に高い警戒心と集中力を維持する必要があります。これは、特にシステム障害や緊急事態に直面した場合に、非常にストレスの多い仕事につながる可能性があります。日々の忙しさにうんざりしており、将来のキャリア開発について考える時間がありません。

では、私たちは運用と保守のキャリアをより良く伸ばす方法についてよく考えているのでしょうか? ‍‍

ブライアン フェザーストーン ハウによって書かれた本「ビジョン」では、キャリア開発の一般的な法則について説明されています。その中で言及されている原則が答えを与えてくれるかもしれません:

10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。

今後 45 年間のことを念頭に置く: 45 年など、より長い期間で計画を立てている場合は、現時点で 1 つの都市や 1 つのプールの損得を気にする必要はありません。そして、明確なキャリアプランがあれば、困難を乗り越えて粘り強く取り組むことが容易になります。

我々がやるべきことは、細分化された技術分野で究極を実現するために、運用保守技術の開発パスを明確にすることです

DevOpsへの変革、いつ起こるかわかりません、いわゆる「DevOpsは死んだ」という議論がテクノロジー界で流行し始めました。しかし、DevOps は決して開発に運用と保守を要求し、運用と保守に行き場をなくすというものではありません。

ただでさえ運用保守作業が大変なので、パニックを起こすのはやめてください。

実際の DevOps に必要なコンポーネントは、プログラマーが自分で処理したり、開発者に操作や操作を任せたりする必要がある散在するオープンソース ツールの束ではなく、内部 DevOps プラットフォームと内部プラットフォームを保守するための専用チームであるべきです。メンテナンスやライブも行っております。真の DevOps チームは、開発、運用、保守を緊密に統合し、責任を共有し、協力して IT パフォーマンスを向上させてビジネスを強化する必要があります。

運用保守から DevOps への変革では、運用保守担当者が継続的インテグレーション、継続的デリバリー、自動テスト、コンテナ化などの主要なツールとテクノロジーを習得する必要があります。同時に、DevOps チームはアジャイル開発、反復開発、継続的開発、デリバリーおよびその他の方法を導入する必要があります。完全な DevOps 文化を確立している企業では、運用と保守の DevOps 作業への移行は非常に優れた開発パスです。

AIOps への変革: 同様に、AIOps は常に、運用および保守の優れたキャリア開発パスでした。 AIOps は、IT 運用および保守担当者が、ログ分析やトラブルシューティングなど、日常的で退屈で価値の低い一部の操作を自動化するのに役立ち、より複雑な問題を解決するためにより多くの時間とエネルギーを解放できます。

同時に、運用および保守作業には、インフラストラクチャ管理、アプリケーション展開、監視、トラブルシューティングなど、多くの側面が含まれます。これらのタスクには、運用および保守担当者の専門的な知識と経験が必要です。

AIOps テクノロジーは IT 運用の効率と精度を向上させますが、人間の運用担当者の作業を完全に置き換えることはできません。代わりに、IT 運用チーム全体の効率と生産性を高めるために協力します。

SRE への変換: ソフトウェア開発スキルを継続的に学習し、自動化ツール、DevOps でのテスト、デプロイ、監視の実践をマスターします。クラウド コンピューティングとコンテナ テクノロジーを学ぶには、SRE はクラウド コンピューティング プラットフォームとコンテナ テクノロジーを理解し、AWS、Docker、Kubernetes などの基本的なクラウド サービスとコンテナ管理ツールを習得する必要があります。信頼性、自動化、実験文化などの中心概念など、組織内に SRE 文化を構築しながら、データ分析スキルを習得します。

以上が10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。