>  기사  >  운영 및 유지보수  >  Flashcat Lai Wei: 운영 및 유지 관리 업무를 안정화하는 방법

Flashcat Lai Wei: 운영 및 유지 관리 업무를 안정화하는 방법

WBOY
WBOY앞으로
2023-06-08 18:42:261531검색

Flashcat Lai Wei: 운영 및 유지 관리 업무를 안정화하는 방법

얼마 전 포럼의 창간호 "Jingyuan - Operation and Maintenance Geometry"와 마치의 "​운영 및 유지 관리 집단을 해고할 시간입니다​"가 업계에서 폭넓은 논의를 불러일으켰고, 운영과 유지보수 직위에 정말 미래가 없는 걸까요? 직장을 꾸준하게 유지하는 방법은 무엇입니까? 이번 호에서는 콰이마오 성운(Kuaimao Nebula)의 라이 웨이(Lai Wei)를 인터뷰했습니다. 라이 웨이는 운영 및 유지 관리 분야에서 벗어나 사업을 시작할 수 있기 때문에 이 문제를 어떻게 보겠습니까? 새로운 소리를 함께 들어보시죠!

현실적이고 수준 높은 "​​백 운영 및 유지 보수 포럼​​"의 세 번째 호입니다. 시작하겠습니다!

자신과 현재 회사를 소개해주세요.

안녕하세요 여러분, 저는 콰이 마오 성운의 라이 웨이입니다. Kuaimao Nebula는 오픈 소스 모니터링 도구인 "Nightingale Monitor"의 핵심 개발 팀으로 구성된 클라우드 기반 지능형 운영 및 유지 관리 기술 회사입니다. Kuaimao Nebula가 만든 클라우드 네이티브 모니터링 및 분석 플랫폼인 "Flashcat 플랫폼"은 클라우드 네이티브 및 하이브리드 클라우드 아키텍처에서 어려운 통합 모니터링과 느린 오류 위치 파악 문제를 해결하는 것을 목표로 합니다.

콰이마오 성운의 창립 비하인드 스토리를 더 알고 싶으시다면 ITPub에서 저와의 단독 인터뷰를 더 읽어보실 수 있습니다.​​"일선 엔지니어에서 CEO까지 10년의 노력"​​ .제 말을 정정해 주셔서 감사합니다.

일부 운영 및 유지 관리 베테랑은 회사가 운영 및 유지 관리의 가치에 대해 거의 알지 못한다고 보고합니다. 운영 및 유지 관리의 가치를 회사에 어떻게 명확하게 설명합니까?

회사 경영진에게 업무의 ​​가치를 이해하기 쉽게 명확하게 설명하고 이해와 지원을 얻는 방법은 모든 중간 및 백엔드 기술 팀이 직면하는 공통 문제입니다. 단 몇 분만에 작업을 수행할 수 있습니다. 운영 및 유지 관리 작업의 가치를 명확하게 설명하는 것은 더욱 어렵습니다.

친구 서클을 보면 운영 및 유지 관리를 해고/전직을 촉구하는 게시물을 가끔 볼 수 있습니다.:

그러나 운영 및 유지 관리의 위치와 그 뒤에 있는 운영 및 유지 관리 인력은 항상 몇 번이고 탈락의 가장자리에 서 있었고, 몇 번이고 완고하게 부활했습니다. . 그들은 종종 자신을 비웃고, 적극적으로 위기를 받아들이고, 과감하게 변화를 추구합니다. 지난 10년 동안 클라우드 컴퓨팅, 클라우드 네이티브, DevOps, SRE 등 IT의 이러한 주요 변화는 모두 "대규모 운영 및 유지 관리" 분야를 지속적으로 최적화하고 개선하려는 시도였습니다. 운영 및 유지 관리 산업은 사라지지 않았지만 계속해서 발전하고 새로운 의미를 띠고 있습니다.

이게 무슨 뜻인가요? 운영과 유지관리가 매우 중요하다는 것을 보여주지만, 운영과 유지관리도 어렵다는 것을 보여줍니다! 그런데 이 가치를 어떻게 명확하게 할 수 있는지 포지셔닝, 목표 설정, 입출력 비율 측면에서 분석해 보겠습니다.

운영 및 유지관리 업무에서 가장 중요한 목표는 무엇이라고 생각하시나요? 이러한 목표를 어떻게 달성했나요? 운영 및 유지 관리의 가치를 어떻게 더 잘 반영할 수 있습니까?

가장 중요한 업무인 전통적인 운영 및 유지 관리 분야에 집중:

  1. 코드 릴리스 및 전달(전달)을 수행하고 라스트 마일에서 가치 전달을 잘 수행합니다.
  2. 확장성을 향상합니다.
  3. 시스템의 안정성(신뢰성)을 보장하고 지속적으로 개선합니다.
  4. 처음 세 가지 목표를 달성하는 동시에 시스템의 운영 비용(finops)을 지속적으로 최적화하고 절감합니다. .

귀하의 업무가 위 범주와 관련이 없다고 판단되면 두 가지 가능성이 있습니다. 운영 및 유지 관리를 담당하지 않거나 업무가 범위를 벗어났습니다!

작업 범위나 운영 및 유지 관리의 임무를 명확히 한 후에는 다음과 같은 목표를 설정하는 것이 비교적 쉽습니다.

  1. 코드 릴리스 및 전달의 경우 릴리스 수로 간단히 측정할 수 있습니다.
  2. 시스템 확장성은 확장 시기로 측정할 수 있습니다.
  3. 안정성을 위해 사용 불가 기간을 관찰할 수 있습니다. 핵심 기능 측정
  4. 시스템 운영 비용의 경우 각 핵심 트랜잭션을 완료하기 위한 자원 비용과 인건비를 계산하여 이를 표현하고 추적할 수 있습니다.

운영 및 유지 관리의 가치를 구현하는 방법:

우선, 우리 운영 및 유지 관리 담당자는 태도와 자세를 바꿔야 합니다. 즉, 비즈니스에 확고히 서서 비즈니스 목표를 공유하도록 노력해야 합니다.

인사부 역시 회사의 백엔드에 속해 백엔드 역할을 할 수 없는 부서인데, 제가 접촉한 우수한 HR 중에는 채용 담당자든, 인사부든. HRBP는 항상 자신을 사업부서로 여기며 회사의 일원이 되고 사업부의 목표를 자체 목표로 간주합니다. 입장이 일관되고 모두가 자기 자신일 때 그 가치는 쉽게 말할 수 있다.

둘째, 값은 항상 "비용 입력"에 해당합니다. 대규모 운영 및 유지 관리 팀을 구성하고 회사에서 인건비가 매우 눈에 띄는 경우 상사의 눈에 쉽게 "핵심 초점"이 될 것이며 상사로부터 더 까다로운 도전을 받게 될 것입니다. 비즈니스 측면에서 말했듯이 Chu 사람들은 재능이 없습니다. 죄책감은 분명합니다 :) 객관적으로 말하면 운영 및 유지 관리 팀의 자원 투자는 비즈니스 수입과 일치해야 합니다. 팀의 발전. 따라서 '운영 및 유지관리의 가치 창출'은 결국 운영 및 유지관리 효율성의 경쟁으로 귀결됩니다.

마지막으로 가치에 관해서는 양적 설명과 정성적 설명이 모두 있어야 합니다. 예를 들어 업계 수준과의 정량적 비교, 회사 사업부 만족도 조사의 정량적 데이터 등이 있습니다. 회사의 전략적 프로젝트를 지원하려면 '존재감'과 같은 질적 데이터도 있어야 합니다.

ChatGPT와 같은 AI 기능이 향후 운영 및 유지보수 산업의 문제를 해결할 수 있다고 생각하시나요?

먼저 ChatGPT의 핵심 장점을 살펴볼까요? ChatGPT는 풍부한 지식, 자연어 이해 기능(및 컨텍스트 이해), 콘텐츠 생성 기능에서 세대 간 혁신을 이루고 있습니다.

그럼 운영 및 유지보수 산업의 핵심 이슈는 무엇인지 분석해 볼까요?

  • 도메인 지식이 부족한 걸까요?
  • 상호작용 효율이 낮은가요?
  • 콘텐츠 출력이 어려우신가요?

위에 해당되지 않습니다. 운영 및 유지 관리 업계에서 다루는 문제는 본질적으로 IT 시스템 가치의 신속한 전달 문제, 확장성 문제 해결, 안정성 문제를 해결하는 것입니다. , 시스템 운영 및 유지 관리의 비용 효율성을 지속적으로 개선합니다.

현재 클라우드 컴퓨팅과 마이크로서비스는 운영 및 유지 관리 산업에 더욱 실질적인 변화를 가져왔습니다. ChatGPT는 운영 및 유지 관리 업계의 지식 축적 문제를 효과적으로 개선할 수 있으며 곧 일부 하급 운영 및 유지 관리 설계자 위치를 대체할 수 있습니다.

도구 선택 시 직접 개발할지, 오픈 소스를 사용할지, 상용 제품을 사용할지 어떻게 결정하시나요?

이 질문에 대한 절대적인 대답은 없습니다. 업계에서의 개인적인 경험에 따르면 아마도 다음과 같은 상황이 있을 것입니다.

자습의 이점:

  1. 자율성과 통제력에 대한 심리적 감각은 더 강해졌습니다 ;
  2. 단기 및 중기적 관점에서 볼 때 팀의 개발 공간에 더 유리할 것입니다.
  3. 실제 상황에 따라 목표 지향적이고 유연한 설계를 수행할 수 있습니다.

자체 연구의 단점:

  1. 시간 비용이 매우 높기 때문에 오랜 시간 지연이 발생하고 사업 발전에 일정한 영향을 미칩니다.
  2. 인건비가 많이 듭니다. 예를 들어 베이징에서는 상대적으로 고위 엔지니어를 채용하려면 연봉이 약 500,000이 필요합니다. 관련 운영 및 유지 관리 도구를 성숙하게 연구하려면 여전히 두 명의 엔지니어를 투자해야 합니다. R&D 인력에 대한 인식, 자체 연구가 용이하고 업계 모범 사례와의 분리로 인해 장기적으로 내부 도구가 시대에 뒤처지게 됩니다.
오픈 소스 및 오픈 소스 보조 개발

:효과적이고 빠르게 생산에 투입할 수 있다는 장점이 있습니다.

세 가지 단점이 있습니다.

오픈 소스 도구는 일반적으로 유연성에 중점을 두고 기능에 중점을 두며 일반적으로 제품화 및 사용자 경험이 부족하고 빠르게 사용할 때 경험 문제가 있습니다. 실제로 다른 사람의 코드를 완전히 읽고 이해하는 것도, 직접 개발하는 것도 똑같이 어렵다는 점을 경험했습니다. 따라서 오픈소스 프로젝트를 프로덕션 환경에 투입할 때는 이를 마스터하는 데 충분한 인력과 시간을 투자해야 합니다. 그 중 오픈소스를 목표로 하는 프로젝트의 2차 개발은 커뮤니티 백본과의 분리로 이어져 최신 후속 버전으로 원활하게 업그레이드할 수 없고, 오픈소스 프로젝트의 실질적인 이점을 누릴 수 없게 됩니다.
  1. 상용 제품 및 솔루션 사용
  2. :
  3. 장점:
  1. 시간과 비용의 이점은 분명합니다. 상용 제품의 도움으로 비즈니스 개발 요구 사항을 신속하고 민첩하게 지원할 수 있습니다.
  2. 원칙적으로 상용 제품의 가격은 자체 개발 제품의 가격보다 몇 배 저렴합니다. 이러한 비용 격차는 비즈니스 모델에 따라 결정됩니다. 상용 제품이 수익을 낼 수 있는 근본적인 이유는 고객이 늘어날수록 제품 연구 및 개발 비용(+판매 비용)이 희석되기 때문입니다. 그렇지 않으면 회사의 의미와 존재 가능성이 없습니다.
  3. 상용 제품의 핵심 경쟁력. 도메인 노하우, 최고의 제품 경험, 우수한 기술 지원 및 서비스가 결합되어 있으며 이는 일반적으로 상용 제품을 사용하는 기술 팀이 회사의 비즈니스 측면에서 더 나은 평판을 얻을 수 있음을 의미합니다.

단점:

  1. 국내 토브 분야는 늦게 시작되었습니다. 현재 고객이 상용 제품을 채택하는 데 방해가 되는 가장 큰 문제는 사용하기 매우 쉬운 제품이 부족하고 확실한 가격 이점이 없다는 것입니다.
  2. 파티A 고객이 많습니다. 상대적으로 풍부한 기술 역사를 가지고 있습니다. 맞춤형 솔루션이 많고 상용 제품과 완벽하게 일치하는 것이 어려운 경우가 많아 고객이 직접 제품을 개발해야 하는 상황이 발생합니다.

클라우드 컴퓨팅, 쿠버네티스 등 인프라의 부상으로 인해 운영 및 유지 관리 직위가 점차 사라질 것이라고 믿는 사람들도 있습니다. 이러한 견해에 대해 어떻게 생각하시나요?

클라우드 컴퓨팅과 K8s의 등장이 주로 '운영 및 유지 관리' 산업을 개선하기 위한 것이라는 점은 사실이며, 이는 운영 및 유지 관리 산업의 작업 방식에 큰 영향을 미쳤습니다. 예:

  • 이전의 clickops는 점차 IaC로 전환되었습니다.
  • 기존 모니터링은 더욱 포괄적인 관찰 시스템으로 업그레이드되었습니다.
  • 릴리스도 대규모 버전의 정기 릴리스에서 더욱 민첩한 지속적 통합으로 변경되었습니다.
  • 오래된 한의학- 스타일의 오픈 소스 소프트웨어 유지 관리 모드는 해당 클라우드 서비스의 올바른 선택 및 사용이 되었습니다. 기계를 선반에 올려놓는 물리적 작업은 몇 분 안에 명령을 입력하여 네트워크 라우팅을 구성하는 전문적인 작업이 되었습니다. 다양한 네트워크 제품의 조합
  • 이 활용도 향상을 위한 물리적 머신 코로케이션에서 마이크로서비스 및 클라우드 네이티브 아키텍처의 사용으로 바뀌었고 비용도 자연스럽게 떨어졌습니다
  • ...
  • 운영 및 유지 관리 작업의 의미가 변하지 않았으며 작업의 가치가 약화되지 않았지만 운영 및 유지 관리에 필요한 스킬 트리가 업그레이드되고 있음을 알 수 있습니다. 운영 및 유지보수 인력이 지속적으로 위기의식을 유지하고 적극적인 변화를 추구하는 정신을 유지하며 비즈니스를 잘 수행하는 데 집중한다면 그들은 추세의 최전선에 머물면서 어디에서나 밝은 미래를 볼 수 있을 것입니다.

선택적인 모니터링 도구가 많이 있습니다. 사용자가 회사의 Flashcat 플랫폼을 선택하는 이유는 무엇입니까?

실제로 오픈소스와 상용 모니터링 플랫폼이 많이 있습니다. 제가 예전에 블로그에 쓴 적이 있습니다: ​"20년 동안의 12가지 오픈소스 모니터링 도구 비교"​​, 참고하시면 됩니다.

Flashcat 플랫폼을 선택한 이유에 앞서, 모니터링 시스템의 개발 동향과 Flashcat 플랫폼의 특징부터 살펴봐야 합니다. 모니터링 시스템의 발전 동향은 제가 이전 블로그에 올린 글인 ​​"클라우드 네이티브 모니터링의 10대 특징 및 동향"​​을 참고하시면 됩니다. Flashcat 플랫폼은 이러한 트렌드에 맞는 솔루션입니다.

Flashcat은 운영 및 유지 관리 엔지니어 그룹부터 모든 R&D, 운영, CTO/CIO, Flashcat에 이르기까지 더 광범위하고 다양한 사용자 그룹을 목표로 합니다. 모니터링 분석 및 정보 만들기

  1. Flashcat은 비즈니스 지표와 밀접하게 연결되어 있습니다: Flashcat은 항상 이를 즉시 감지하고 IT 시스템과 심층적으로 연결하여 기술 팀이 신속하게 조사를 시작할 수 있도록 지원합니다. 클라우드 네이티브 및 하이브리드 클라우드의 통합 모니터링: 어떤 종류의 IT 아키텍처를 채택하더라도 Flashcat 플랫폼만 있으면 됩니다.

위 내용은 Flashcat Lai Wei: 운영 및 유지 관리 업무를 안정화하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제