ホームページ  >  記事  >  運用・保守  >  Flashcat Lai Wei: 運用保守の仕事を安定させる方法

Flashcat Lai Wei: 運用保守の仕事を安定させる方法

WBOY
WBOY転載
2023-06-08 18:42:261543ブラウズ

Flashcat Lai Wei: 運用保守の仕事を安定させる方法

フォーラム「京源 - 運用と保守の幾何学」の最初の号と、少し前の Ma Chi の「」は、「運用」を行う時間です。 「保守要員は一括解雇された」という報道が業界内で広く議論を呼んでいますが、本当に運用保守職に未来はないのでしょうか?仕事を安定させるにはどうすればよいですか?今回は、クアイマオ星雲のライ・ウェイさんにインタビューしました。ライ・ウェイさんは、運用・保守の枠から抜け出して起業する起業家であり、起業できる以上、業界での経験も豊富なはずですが、この問題をどう捉えているのでしょうか?一緒に新しい音を聴きましょう!

今回は、地に足の着いたハイレベルな「

運用保守百人フォーラム」の第3回目です、始めましょう!

自己紹介と現在の会社について説明してください。

みなさんこんにちは、クアイマオ星雲のライウェイです。 Kuaimao Nebula は、オープンソース監視ツール「Nightingale Monitor」の中核開発チームで構成される、クラウドネイティブのインテリジェント運用保守テクノロジー企業です。 Kuaimao Nebula によって作成されたクラウドネイティブの監視および分析プラットフォームである「Flashcat プラットフォーム」は、クラウドネイティブおよびハイブリッド クラウド アーキテクチャ下での困難な統合監視と遅い障害位置の問題を解決することを目的としています。

Kuaimao Nebula の設立の背後にあるストーリーについて詳しく知りたい場合は、ITPub で私との独占インタビューを読むことができます。

「第一線のエンジニアからエンジニアに至るまでの 10 年間の努力CEO" 、皆さんの修正を歓迎します。

運用および保守のベテランの中には、会社が運用および保守の価値についてほとんど知らないと報告する人もいます。運用および保守の価値を会社に明確に説明するにはどうすればよいですか?

仕事の価値を経営陣にいかに分かりやすく説明し、理解とサポートを得るかは、ミドル・バックエンド技術者全員が直面する共通の課題です。そうしないと、数分で仕事を失うことになるため、運用保守作業の価値を明確に説明するのはさらに困難です。

私の友人関係から判断すると、運用保守の解雇や転職を促す投稿を時々見かけます

:

たとえば、スウェーデンの馬作業員
    「運営とメンテナンスを一括して一時解雇する時が来た」
  • 、感動的で啓発的な、冒頭で述べた: 真実を知っている人は知らない秘密を語る: クラウドネイティブとDevOpsが成熟した現在、私たちは立場として、チームとして、歴史的な使命を終え、舞台から引退すべきです。 もう 1 つの例は、私をこの業界に紹介してくれた Jing 上司です。SRETalk の創刊号で、彼は次のような善意のアドバイスを与えてくれました。時代の変化、役職の死は普通のことであり、タイムリーな調整と計画が思考の焦点です。
  • しかし、
  • 運用保守の立場とその背後にいる運用保守担当者は、何度も何度も淘汰の危機に瀕し、頑なに守り続けてきました。何度でも生き返る、柳は暗く、花は明るい。彼らはしばしば自分自身を喜んで笑い、積極的に危機を受け入れ、あえて変化を求めます。過去 10 年間を振り返ると、クラウド コンピューティング、クラウド ネイティブ、DevOps、SRE のいずれであっても、IT におけるこれらの大きな変化はすべて、「大規模な運用と保守」の分野を継続的に最適化および改善する試みでした。運用保守業界は消滅したわけではなく、進化を続け、新たな意味合いを獲得してきました。

これは何を示していますか?これは、運用と保守が非常に重要であることを示していますが、運用と保守が難しいことも示しています。しかし、この値を明確に説明するにはどうすればよいでしょうか?ポジショニング、目標設定、産業連関比率の観点から分析してみましょう。

運用保守作業の最も重要な目標は何だと思いますか?これらの目標をどのように達成しましたか?運用と保守の価値をより適切に反映するにはどうすればよいでしょうか?

最も重要な職務責任である従来の運用および保守の分野に焦点を当てます

:

コードのリリースと配信 (配信)、ラストマイルで価値を提供するために適切な仕事をする;

    アーキテクチャのスケーラビリティを改善し、実装する;
  1. システムの安定性 (信頼性) を確保し、継続的に改善する;
  2. 最初の 3 つの目標を達成しながら、システムの運用コスト (finops) を継続的に最適化して削減します。
  3. あなたの仕事が上記のカテゴリを中心に展開していないことがわかった場合は、2 つの可能性があります。運用と保守に携わっていないか、またはあなたの仕事が範囲を超えています。
作業範囲、つまり運用保守の使命を明確にすると、次のような目標を設定するのが比較的簡単になります。

  1. コードのリリースと配信については、リリースの数によって単純に測定できます。
  2. システムのスケーラビリティについては、拡張の適時性によって測定できます。
  3. 安定性については、コア機能が利用できない期間を観察することで測定できます。
  4. システム運用コストについては、各コア トランザクションの完了に費やされるリソース コストと人件費を計算して追跡できます。

運用保守の価値をどう体現するかについて:

まずは運用保守担当者の意識やスタンスを変え、しっかりと立つことビジネスと連携し、ビジネス目標の共有に努めます。

一例を挙げますと、人事部も会社のバックエンドに属する部門であり、バックエンドとしては使えませんが、私がこれまで接してきた優秀な人事の中には、事業部門の一員として、事業部門の目標を自分自身の目標として捉えてください。立場が一貫していて、全員が自分の人間であれば、価値を言いやすくなります。

第二に、価値は常に「コスト投入」に関連しています。大規模な運用保守チームを設立し、社内で人件費が非常に高く設定されている場合、あなたは上司の目に簡単に「重要な焦点」となり、上司からより厳しい課題にさらされることになります。ビジネス面。諺にあるように、チュー人には才能がありません。罪は明らかです:) 客観的に言えば、運用保守チームのリソース投資は事業収入と一致する必要があります。高すぎても低すぎても不健全であり、ビジネスの利益にもつながりません。チームの発展。したがって、「運用・保守における価値創造」は、最終的には運用・保守効率の競争に帰着します。

最後に、価値については、定量的記述と定性的記述の両方が必要です。例えば、業界レベルとの定量的な比較、企業の事業部門満足度調査の定量的なデータなどです。企業の戦略プロジェクトを支える「存在感」などの定性的なデータも必要です。

ChatGPT のような AI 機能は、将来的に運用保守業界の問題を解決できると思いますか?

まず第一に、ChatGPT の主な利点は何でしょうか? ChatGPT は、豊富な知識、自然言語理解機能 (およびコンテキスト理解)、およびコンテンツ生成機能の点で世代を超えた革新性を持っています。

それでは、運用保守業界の中核的な問題は何なのかを分析してみましょう。

  • ドメインの知識が不足しているのでしょうか?
  • インタラクション効率は低いですか?
  • コンテンツのアウトプットは難しいですか?

上記のいずれにも当てはまりません。運用保守業界が扱う問題は、本質的にはシステム エンジニアリングの問題です。IT システムの価値を迅速に提供するという問題を解決し、拡張性の問題を解決することです。 、安定性の問題を解決しますが、問題はシステムの運用と保守の費用対効果を継続的に向上させることです。

現在、クラウド コンピューティングとマイクロサービスは、運用保守業界にさらに大きな変化をもたらしています。 ChatGPT は、運用および保守業界における知識の蓄積の問題を効果的に改善することができ、間もなく一部のジュニア運用および保守アーキテクトの職に取って代わられる可能性があります。

ツールの選択に関しては、自分で開発するか、オープンソースを使用するか、商用製品を使用するかをどのように決定しますか?

この質問に対する絶対的な答えはありません。私の個人的な経験から、おそらく次のような状況が考えられます:

自己研究の利点

  1. 心理的な自律性とコントロールの感覚が強化されます;
  2. 短期および中期的には、チームの開発スペースにとってより有益になります;
  3. 自らの実情に応じて、的を絞った柔軟な設計ができる。

自己調査のデメリット:

  1. 時間コストが非常に高くつくため、長時間の遅れが生じ、マイナスの結果がもたらされます。事業の発展に確実な影響;
  2. 人件費が高い北京を例にとると、比較的上級の技術者を採用する必要があり、年収は50万程度。 - 研究関連の運用および保守ツールが成熟するまでは、2 人の投資が必要です エンジニアはまだ必要です;
  3. 研究開発担当者の認識によって制限されるため、自己研究は業界のベスト プラクティスから簡単に切り離すことができます。長期的には社内ツールが時代に遅れる原因となります。

オープンソースおよびオープンソースの二次開発:

利点は、効果を迅速に発揮して本番環境に導入できることです。

オープンソース ツールは、一般的に柔軟性を重視し、比較的機能に重点を置いており、製品化やユーザー エクスペリエンスが欠けていることが多いです。質問;
  1. コードを書く人は誰でも経験を持っています。実際、他の人のコードを完全に読んで理解し、自分でコードを開発することも同様に難しいのです。したがって、オープンソース プロジェクトが本番環境に導入されるときは、十分な投資が必要です。習得するには人手と時間が必要です。
  2. オープンソース プロジェクトの二次開発のほとんどは、コミュニティ バックボーンからの切り離しにつながり、その結果、後続の最新バージョンにスムーズにアップグレードできなくなります。 、そしてオープンソースプロジェクトの本当の恩恵を享受できないこと。
商用製品とソリューションを使用する

:利点:

  1. 時間コストの利点は明らかです。商用製品の助けを借りて、ビジネスの開発ニーズを迅速かつ機敏にサポートできます。まず第一に、遅れてはいけません。
  2. 製品化された製品のコストは、原則として自社開発製品に比べて数倍低くなります。このコストギャップはビジネスモデルによって決まります。市販品が儲かる根本的な理由は、顧客数の増加に伴って商品の研究開発費(+販売費)が希薄化するからであり、そうでなければ企業の存在意義も可能性もありません。商用製品の競争力には、ノウハウ、究極の製品エクスペリエンス、優れた技術サポートとサービスが含まれます。これは通常、商用製品を使用する技術チームが企業のビジネス面でより良い評価を得ることを意味します。
  3. 欠点:

国内tob分野のスタートが遅れている 現在、顧客の商用製品導入を妨げている最大の問題は、非常に使いやすい製品が存在しないことと、価格的な利点がないことは明らかです;
  1. 当事者 A の顧客の多くは、豊富な技術的歴史と多くの個別化されたソリューションを持っています。商用製品と完全に一致することは多くの場合困難であり、その結果、顧客は苦肉の策で独自の製品を開発することを選択する必要があります。自社製品。

業界では、クラウド コンピューティングや Kubernetes などのインフラストラクチャの台頭により、運用保守の職が徐々に排除されるという見方がありますが、この見方についてはどう思いますか? クラウド コンピューティングと K8s の登場は主に「運用保守」業界の改善を目的としており、運用保守の働き方に大きな影響を与えているのは事実です。業界。例:

以前のクリック操作は段階的に IaC に移行しました
  • 従来の監視はより包括的な可観測性システムにアップグレードされました
  • リリースも大型バージョンの通常リリースから変更されましたより機敏な継続的インテグレーション
  • 古い漢方薬スタイルのオープンソース ソフトウェア メンテナンス モデルは、対応するクラウド サービスの正しい選択と使用になりました
  • マシンをコンピュータに設置する物理的な作業シェルフがシンプルになりました コンソールは数分で開きます
  • コマンドを入力してネットワーク ルーティングを構成する専門的な作業が、クラウド サービスのさまざまなネットワーク製品の組み合わせとマッチングに変換されます
  • 物理的なものからの変換マイクロシステムの使用率を向上させるためのマシンのコロケーション サービスとクラウドネイティブ アーキテクチャのコストは自然に低下しました
  • #…
  • 運用保守の業務内容は変わらず、業務の価値も薄れておらず、運用保守に必要なスキルツリーも高度化している。運用保守担当者が危機感を持ち続け、変化を求める積極的な精神を維持し、ビジネスにうまく貢献することに集中すれば、トレンドを常に把握し、あらゆる場所で明るい未来を見ることができるでしょう。

#オプションの監視ツールが多数ありますが、ユーザーはなぜ御社の Flashcat プラットフォームを選択するのでしょうか?

確かに、多くのオープンソースおよび商用監視プラットフォームがあります。私も以前に次のブログを書きました: 「過去 20 年間の 12 の主要なオープンソース監視ツール」比較》

を参考にしてください。

Flashcat プラットフォームを選択した理由に戻り、監視システムの開発トレンドと Flashcat プラットフォームの特徴から始める必要があります。監視システムの開発傾向については、私の以前のブログ記事 「クラウド ネイティブ監視のトップ 10 の特徴と傾向」

を参照してください。 Flashcat プラットフォームは、次のトレンドを対象としたソリューションです。

Flashcat は、運用および保守エンジニア グループからすべての研究開発者まで、より広範囲で多様なユーザー グループを対象としています。オペレーション、CTO/CIO、Flashcat により、監視分析と情報収集が非常に簡単になります。
  1. Flashcat はビジネス指標と密接にリンクしています: ビジネスが損害を受けた場合、Flashcat は常に最初の発見となることができます、IT システムとの綿密な連携により、技術チームが迅速に調査を開始できるよう支援します。
  2. クラウド ネイティブおよびハイブリッド クラウドの統合監視: どのような種類の IT アーキテクチャが採用されていても、必要な Flashcat プラットフォームは 1 セットだけです。

以上がFlashcat Lai Wei: 運用保守の仕事を安定させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。