検索
ホームページ運用・保守安全性Flashcat Lai Wei: 運用保守の仕事を安定させる方法

Flashcat Lai Wei: 運用保守の仕事を安定させる方法

フォーラム「京源 - 運用と保守の幾何学」の最初の号と、少し前の Ma Chi の「」は、「運用」を行う時間です。 「保守要員は一括解雇された」という報道が業界内で広く議論を呼んでいますが、本当に運用保守職に未来はないのでしょうか?仕事を安定させるにはどうすればよいですか?今回は、クアイマオ星雲のライ・ウェイさんにインタビューしました。ライ・ウェイさんは、運用・保守の枠から抜け出して起業する起業家であり、起業できる以上、業界での経験も豊富なはずですが、この問題をどう捉えているのでしょうか?一緒に新しい音を聴きましょう!

今回は、地に足の着いたハイレベルな「

運用保守百人フォーラム」の第3回目です、始めましょう!

自己紹介と現在の会社について説明してください。

みなさんこんにちは、クアイマオ星雲のライウェイです。 Kuaimao Nebula は、オープンソース監視ツール「Nightingale Monitor」の中核開発チームで構成される、クラウドネイティブのインテリジェント運用保守テクノロジー企業です。 Kuaimao Nebula によって作成されたクラウドネイティブの監視および分析プラットフォームである「Flashcat プラットフォーム」は、クラウドネイティブおよびハイブリッド クラウド アーキテクチャ下での困難な統合監視と遅い障害位置の問題を解決することを目的としています。

Kuaimao Nebula の設立の背後にあるストーリーについて詳しく知りたい場合は、ITPub で私との独占インタビューを読むことができます。

「第一線のエンジニアからエンジニアに至るまでの 10 年間の努力CEO" 、皆さんの修正を歓迎します。

運用および保守のベテランの中には、会社が運用および保守の価値についてほとんど知らないと報告する人もいます。運用および保守の価値を会社に明確に説明するにはどうすればよいですか?

仕事の価値を経営陣にいかに分かりやすく説明し、理解とサポートを得るかは、ミドル・バックエンド技術者全員が直面する共通の課題です。そうしないと、数分で仕事を失うことになるため、運用保守作業の価値を明確に説明するのはさらに困難です。

私の友人関係から判断すると、運用保守の解雇や転職を促す投稿を時々見かけます

:

たとえば、スウェーデンの馬作業員
    「運営とメンテナンスを一括して一時解雇する時が来た」
  • 、感動的で啓発的な、冒頭で述べた: 真実を知っている人は知らない秘密を語る: クラウドネイティブとDevOpsが成熟した現在、私たちは立場として、チームとして、歴史的な使命を終え、舞台から引退すべきです。 もう 1 つの例は、私をこの業界に紹介してくれた Jing 上司です。SRETalk の創刊号で、彼は次のような善意のアドバイスを与えてくれました。時代の変化、役職の死は普通のことであり、タイムリーな調整と計画が思考の焦点です。
  • しかし、
  • 運用保守の立場とその背後にいる運用保守担当者は、何度も何度も淘汰の危機に瀕し、頑なに守り続けてきました。何度でも生き返る、柳は暗く、花は明るい。彼らはしばしば自分自身を喜んで笑い、積極的に危機を受け入れ、あえて変化を求めます。過去 10 年間を振り返ると、クラウド コンピューティング、クラウド ネイティブ、DevOps、SRE のいずれであっても、IT におけるこれらの大きな変化はすべて、「大規模な運用と保守」の分野を継続的に最適化および改善する試みでした。運用保守業界は消滅したわけではなく、進化を続け、新たな意味合いを獲得してきました。

これは何を示していますか?これは、運用と保守が非常に重要であることを示していますが、運用と保守が難しいことも示しています。しかし、この値を明確に説明するにはどうすればよいでしょうか?ポジショニング、目標設定、産業連関比率の観点から分析してみましょう。

運用保守作業の最も重要な目標は何だと思いますか?これらの目標をどのように達成しましたか?運用と保守の価値をより適切に反映するにはどうすればよいでしょうか?

最も重要な職務責任である従来の運用および保守の分野に焦点を当てます

:

コードのリリースと配信 (配信)、ラストマイルで価値を提供するために適切な仕事をする;

    アーキテクチャのスケーラビリティを改善し、実装する;
  1. システムの安定性 (信頼性) を確保し、継続的に改善する;
  2. 最初の 3 つの目標を達成しながら、システムの運用コスト (finops) を継続的に最適化して削減します。
  3. あなたの仕事が上記のカテゴリを中心に展開していないことがわかった場合は、2 つの可能性があります。運用と保守に携わっていないか、またはあなたの仕事が範囲を超えています。
作業範囲、つまり運用保守の使命を明確にすると、次のような目標を設定するのが比較的簡単になります。

  1. コードのリリースと配信については、リリースの数によって単純に測定できます。
  2. システムのスケーラビリティについては、拡張の適時性によって測定できます。
  3. 安定性については、コア機能が利用できない期間を観察することで測定できます。
  4. システム運用コストについては、各コア トランザクションの完了に費やされるリソース コストと人件費を計算して追跡できます。

運用保守の価値をどう体現するかについて:

まずは運用保守担当者の意識やスタンスを変え、しっかりと立つことビジネスと連携し、ビジネス目標の共有に努めます。

一例を挙げますと、人事部も会社のバックエンドに属する部門であり、バックエンドとしては使えませんが、私がこれまで接してきた優秀な人事の中には、事業部門の一員として、事業部門の目標を自分自身の目標として捉えてください。立場が一貫していて、全員が自分の人間であれば、価値を言いやすくなります。

第二に、価値は常に「コスト投入」に関連しています。大規模な運用保守チームを設立し、社内で人件費が非常に高く設定されている場合、あなたは上司の目に簡単に「重要な焦点」となり、上司からより厳しい課題にさらされることになります。ビジネス面。諺にあるように、チュー人には才能がありません。罪は明らかです:) 客観的に言えば、運用保守チームのリソース投資は事業収入と一致する必要があります。高すぎても低すぎても不健全であり、ビジネスの利益にもつながりません。チームの発展。したがって、「運用・保守における価値創造」は、最終的には運用・保守効率の競争に帰着します。

最後に、価値については、定量的記述と定性的記述の両方が必要です。例えば、業界レベルとの定量的な比較、企業の事業部門満足度調査の定量的なデータなどです。企業の戦略プロジェクトを支える「存在感」などの定性的なデータも必要です。

ChatGPT のような AI 機能は、将来的に運用保守業界の問題を解決できると思いますか?

まず第一に、ChatGPT の主な利点は何でしょうか? ChatGPT は、豊富な知識、自然言語理解機能 (およびコンテキスト理解)、およびコンテンツ生成機能の点で世代を超えた革新性を持っています。

それでは、運用保守業界の中核的な問題は何なのかを分析してみましょう。

  • ドメインの知識が不足しているのでしょうか?
  • インタラクション効率は低いですか?
  • コンテンツのアウトプットは難しいですか?

上記のいずれにも当てはまりません。運用保守業界が扱う問題は、本質的にはシステム エンジニアリングの問題です。IT システムの価値を迅速に提供するという問題を解決し、拡張性の問題を解決することです。 、安定性の問題を解決しますが、問題はシステムの運用と保守の費用対効果を継続的に向上させることです。

現在、クラウド コンピューティングとマイクロサービスは、運用保守業界にさらに大きな変化をもたらしています。 ChatGPT は、運用および保守業界における知識の蓄積の問題を効果的に改善することができ、間もなく一部のジュニア運用および保守アーキテクトの職に取って代わられる可能性があります。

ツールの選択に関しては、自分で開発するか、オープンソースを使用するか、商用製品を使用するかをどのように決定しますか?

この質問に対する絶対的な答えはありません。私の個人的な経験から、おそらく次のような状況が考えられます:

自己研究の利点

  1. 心理的な自律性とコントロールの感覚が強化されます;
  2. 短期および中期的には、チームの開発スペースにとってより有益になります;
  3. 自らの実情に応じて、的を絞った柔軟な設計ができる。

自己調査のデメリット:

  1. 時間コストが非常に高くつくため、長時間の遅れが生じ、マイナスの結果がもたらされます。事業の発展に確実な影響;
  2. 人件費が高い北京を例にとると、比較的上級の技術者を採用する必要があり、年収は50万程度。 - 研究関連の運用および保守ツールが成熟するまでは、2 人の投資が必要です エンジニアはまだ必要です;
  3. 研究開発担当者の認識によって制限されるため、自己研究は業界のベスト プラクティスから簡単に切り離すことができます。長期的には社内ツールが時代に遅れる原因となります。

オープンソースおよびオープンソースの二次開発:

利点は、効果を迅速に発揮して本番環境に導入できることです。

オープンソース ツールは、一般的に柔軟性を重視し、比較的機能に重点を置いており、製品化やユーザー エクスペリエンスが欠けていることが多いです。質問;
  1. コードを書く人は誰でも経験を持っています。実際、他の人のコードを完全に読んで理解し、自分でコードを開発することも同様に難しいのです。したがって、オープンソース プロジェクトが本番環境に導入されるときは、十分な投資が必要です。習得するには人手と時間が必要です。
  2. オープンソース プロジェクトの二次開発のほとんどは、コミュニティ バックボーンからの切り離しにつながり、その結果、後続の最新バージョンにスムーズにアップグレードできなくなります。 、そしてオープンソースプロジェクトの本当の恩恵を享受できないこと。
商用製品とソリューションを使用する

:利点:

  1. 時間コストの利点は明らかです。商用製品の助けを借りて、ビジネスの開発ニーズを迅速かつ機敏にサポートできます。まず第一に、遅れてはいけません。
  2. 製品化された製品のコストは、原則として自社開発製品に比べて数倍低くなります。このコストギャップはビジネスモデルによって決まります。市販品が儲かる根本的な理由は、顧客数の増加に伴って商品の研究開発費(+販売費)が希薄化するからであり、そうでなければ企業の存在意義も可能性もありません。商用製品の競争力には、ノウハウ、究極の製品エクスペリエンス、優れた技術サポートとサービスが含まれます。これは通常、商用製品を使用する技術チームが企業のビジネス面でより良い評価を得ることを意味します。
  3. 欠点:

国内tob分野のスタートが遅れている 現在、顧客の商用製品導入を妨げている最大の問題は、非常に使いやすい製品が存在しないことと、価格的な利点がないことは明らかです;
  1. 当事者 A の顧客の多くは、豊富な技術的歴史と多くの個別化されたソリューションを持っています。商用製品と完全に一致することは多くの場合困難であり、その結果、顧客は苦肉の策で独自の製品を開発することを選択する必要があります。自社製品。

業界では、クラウド コンピューティングや Kubernetes などのインフラストラクチャの台頭により、運用保守の職が徐々に排除されるという見方がありますが、この見方についてはどう思いますか? クラウド コンピューティングと K8s の登場は主に「運用保守」業界の改善を目的としており、運用保守の働き方に大きな影響を与えているのは事実です。業界。例:

以前のクリック操作は段階的に IaC に移行しました
  • 従来の監視はより包括的な可観測性システムにアップグレードされました
  • リリースも大型バージョンの通常リリースから変更されましたより機敏な継続的インテグレーション
  • 古い漢方薬スタイルのオープンソース ソフトウェア メンテナンス モデルは、対応するクラウド サービスの正しい選択と使用になりました
  • マシンをコンピュータに設置する物理的な作業シェルフがシンプルになりました コンソールは数分で開きます
  • コマンドを入力してネットワーク ルーティングを構成する専門的な作業が、クラウド サービスのさまざまなネットワーク製品の組み合わせとマッチングに変換されます
  • 物理的なものからの変換マイクロシステムの使用率を向上させるためのマシンのコロケーション サービスとクラウドネイティブ アーキテクチャのコストは自然に低下しました
  • #…
  • 運用保守の業務内容は変わらず、業務の価値も薄れておらず、運用保守に必要なスキルツリーも高度化している。運用保守担当者が危機感を持ち続け、変化を求める積極的な精神を維持し、ビジネスにうまく貢献することに集中すれば、トレンドを常に把握し、あらゆる場所で明るい未来を見ることができるでしょう。

#オプションの監視ツールが多数ありますが、ユーザーはなぜ御社の Flashcat プラットフォームを選択するのでしょうか?

確かに、多くのオープンソースおよび商用監視プラットフォームがあります。私も以前に次のブログを書きました: 「過去 20 年間の 12 の主要なオープンソース監視ツール」比較》

を参考にしてください。

Flashcat プラットフォームを選択した理由に戻り、監視システムの開発トレンドと Flashcat プラットフォームの特徴から始める必要があります。監視システムの開発傾向については、私の以前のブログ記事 「クラウド ネイティブ監視のトップ 10 の特徴と傾向」

を参照してください。 Flashcat プラットフォームは、次のトレンドを対象としたソリューションです。

Flashcat は、運用および保守エンジニア グループからすべての研究開発者まで、より広範囲で多様なユーザー グループを対象としています。オペレーション、CTO/CIO、Flashcat により、監視分析と情報収集が非常に簡単になります。
  1. Flashcat はビジネス指標と密接にリンクしています: ビジネスが損害を受けた場合、Flashcat は常に最初の発見となることができます、IT システムとの綿密な連携により、技術チームが迅速に調査を開始できるよう支援します。
  2. クラウド ネイティブおよびハイブリッド クラウドの統合監視: どのような種類の IT アーキテクチャが採用されていても、必要な Flashcat プラットフォームは 1 セットだけです。

以上がFlashcat Lai Wei: 運用保守の仕事を安定させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
运维工作十多年,无数个瞬间、我觉得自己还是个小白...运维工作十多年,无数个瞬间、我觉得自己还是个小白...Jun 09, 2023 pm 09:53 PM

​曾几何时,当我还是一名初出茅庐的计算机专业应届生的时候,在招聘网站上浏览了很多招聘贴,眼花缭乱的技术岗位让我摸不着头脑:研发工程师、运维工程师、测试工程师...‍大学期间专业课马马虎虎,更谈不上有什么技术视野,对于具体从事那个技术方向并没有什么明确的想法。直到一位学长对我说:“做运维吧,做运维不用天天写代码,会玩Liunx就行!比做开发轻松多了!”‍‍‍‍‍‍‍‍我选择了相信......入行十多年,吃过很多苦,背了很多锅,弄死过服务器,经历过部门裁员,如果有人现在跟我说做运维比开发简单,那我会

Spring Boot Actuator端点大揭秘:轻松监控你的应用程序Spring Boot Actuator端点大揭秘:轻松监控你的应用程序Jun 09, 2023 pm 10:56 PM

一、SpringBootActuator端点简介1.1什么是Actuator端点SpringBootActuator是一个用于监控和管理SpringBoot应用程序的子项目。它提供了一系列内置的端点(Endpoints),这些端点可以用于查看应用程序的状态、运行情况和运行指标。Actuator端点可以以HTTP、JMX或其他形式暴露给外部系统,便于运维人员对应用程序进行监控、诊断和管理。1.2端点的作用和功能Actuator端点主要用于实现以下功能:提供应用程序的健康检查,包括数据库连接、缓存、

Spring Cloud微服务架构部署与运维Spring Cloud微服务架构部署与运维Jun 23, 2023 am 08:19 AM

随着互联网的快速发展,企业级应用的复杂度日益增加。针对这种情况,微服务架构应运而生。它以模块化、独立部署、可扩展性高等特点,成为当今企业级应用开发的首选。作为一种优秀的微服务架构,SpringCloud在实际应用中展现出了极大的优势。本文将介绍SpringCloud微服务架构的部署与运维。一、部署SpringCloud微服务架构SpringCloud

PG数据库运维工具要覆盖哪些能力PG数据库运维工具要覆盖哪些能力Jun 08, 2023 pm 06:56 PM

​过节前我和PG中国社区合作搞了一个关于如何使用D-SMART来运维PG数据库的线上直播,正好我的一个金融行业的客户听了我的介绍,打电话过来聊了聊。他们正在做数据库信创的选型,也试用了多个国产数据库,最后他们准备选择TDSQL。当时我觉得有点意外,他们从2020年就开始在做国产数据库选型,不过好像最初使用TDSQL后的感受并不太好。后来经过沟通才了解到,他们刚开始使用TDSQL的分布式数据库,发现对研发要求太高,所以后来就全部选择TDSQL的集中式MYSQL实例,用下来发现挺好用的。整个数据库云

途游邹轶:中小公司的运维怎么做?途游邹轶:中小公司的运维怎么做?Jun 09, 2023 pm 01:56 PM

通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。这里是接地气、有高度的《​​​运维百家讲坛​​》第6期,开讲!问题预览途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?游戏运维的人

什么是可观测性?初学者需要知道的一切什么是可观测性?初学者需要知道的一切Jun 08, 2023 pm 02:42 PM

可观测性一词来源于工程领域,近年来在软件开发领域也日益流行。简而言之,可观测性是指根据外部输出以了解系统内部状态的能力。IBM对可观测性的定义为:通常,可观测性是指基于对复杂系统外部输出的了解就能够了解其内部状态或状况的程度。系统越可观测,定位性能问题根本原因的过程就能越快速且准确,而无需进行额外的测试或编码。在云计算中,可观测性还指对分布式应用系统及支撑其运行的基础设施的数据进行聚合、关联和分析的软件工具和实践,以便对应用系统进行更有效地监控、故障排除和调试,从而实现客户体验优化、服务水平协议

运维要不要学golang吗运维要不要学golang吗Jul 17, 2023 pm 01:27 PM

运维不要学golang,其原因是:1、golang主要被用于开发高性能和并发性能要求较高的应用程序;2、运维工程师通常使用的工具和脚本语言已经能够满足大部分的管理和维护需求;3、学习golang需要一定的编程基础和经验;4、运维工程师的主要目标是确保系统的稳定和高可用性,而不是开发应用程序。

Uber实践:运维大型分布式系统的一些心得Uber实践:运维大型分布式系统的一些心得Jun 09, 2023 pm 04:53 PM

本文是Uber的工程师GergelyOrosz的文章,原文地址在:https://blog.pragmaticengineer.com/operating-a-high-scale-distributed-system/在过去的几年里,我一直在构建和运营一个大型分布式系统:优步的支付系统。在此期间,我学到了很多关于分布式架构概念的知识,并亲眼目睹了高负载和高可用性系统运行的挑战(一个系统远远不是开发完了就完了,线上运行的挑战实际更大)。构建系统本身是一项有趣的工作。规划系统如何处理10x/100

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境