>운영 및 유지보수 >안전 >10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다.

10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다.

PHPz
PHPz앞으로
2023-06-09 21:53:11918검색

​옛날에 저는 컴퓨터 과학을 전공하는 신입생이었을 때 채용 웹사이트에서 많은 채용 공고를 검색했습니다. R&D 엔지니어, 운영 및 유지 관리 엔지니어, 테스트 엔지니어 등 눈에 띄는 기술 직위에 대해 혼란스러웠습니다.

대학 시절 내 전문 과정은 그저 그랬고, 기술적인 비전도 없었고, 어떤 기술적인 방향을 추구해야 할지 명확한 아이디어도 없었습니다.

한 선배가 나에게 이렇게 말했습니다. "운영 및 유지 관리를 하세요. 운영 및 유지 관리를 위해 매일 코드를 작성할 필요는 없습니다. Liunx를 사용할 수 있으면 됩니다! 개발을 하는 것보다 훨씬 쉽습니다!"

‍‍‍‍‍‍‍나는 믿기로 했어요...

저는 10년 넘게 업계에 종사하면서 많은 어려움을 겪었고, 많은 비난을 받고, 서버를 죽이고, 부서를 해고하는 경험을 했습니다. 개발보다 운영 및 유지보수가 쉽기 때문에 망설임 없이 끌어당기겠습니다. 블랙...‍‍‍‍‍‍

기본적인 운영 및 유지보수 작업은 매우 간단하지만, 운영 및 유지보수 작업의 가장 큰 특징은 복잡하다는 점입니다

에 제 생각에는 운영 및 유지 관리 작업은 기술 세부 정보 처리, 다양한 플랫폼의 통합 및 구성, 다양하고 복잡한 문제 및 오류 해결이 필요한 가장 복잡한 기술 작업 중 하나일 수 있습니다. 따라서 운영 및 유지 관리 인력은 변화하는 기술 및 비즈니스 요구에 대처할 수 있는 광범위한 기술과 지식이 필요합니다.

운영 및 유지 관리는 종종 복잡한 플랫폼 운영 및 유지 관리 작업에 직면합니다. 그 이유는 기업이 일반적으로 관리하고 모니터링해야 하는 것은 단일 플랫폼과 시스템이 아니라 훨씬 더 복잡하기 때문입니다. 이러한 시스템은 다양한 공급업체에서 제공될 수 있으며 서버, 스토리지, 네트워크, 애플리케이션 등을 포함한 다양한 프로토콜과 기술을 사용할 수 있습니다.

번거로운 구성 관리도 운영 및 유지 관리 작업의 어려움 중 하나입니다. 구성 관리에는 시스템 설치, 구성 업데이트, 소프트웨어 설치 및 업데이트 등과 같은 많은 작업이 포함됩니다. 이러한 작업은 시스템 전체에서 조정되고 실행되어야 합니다.

대규모 클러스터의 관리도 간단하지 않습니다. 대기업은 수천 대의 서버를 관리해야 하며, 이를 위해서는 강력한 도구와 자동화 기술이 필요합니다. 운영 직원에게는 구성, 업데이트, 모니터링 및 보고를 관리하기 위한 자동화된 도구가 필요합니다.

운영 및 유지보수 보안 문제도 무시할 수 없습니다. 운영 및 유지보수 인력은 회사의 자산과 데이터를 보호하고 시스템의 보안을 보장해야 합니다. 여기에는 방화벽, 침입 탐지 시스템, 보안 패치 관리 등이 포함될 수 있습니다.

운영 및 유지 관리에는 풍부한 문제 해결 경험도 필요합니다. 오류는 운영 및 유지 관리 작업에서 흔히 발생하는 문제입니다. 시스템에 문제가 발생하면 운영 및 유지 관리 담당자는 신속하게 오류를 찾아 서비스를 복원하기 위한 조치를 취해야 합니다.

지속적인 학습은 운영 및 유지보수 담당자에게 가장 기본적인 요구 사항입니다. 운영 및 유지 관리 도구와 기술의 급속한 발전은 과장되어 있으며, IT 기술은 끊임없이 발전하고 있으며, 새로운 기술과 도구는 끊임없이 등장하며, 운영 및 유지 관리 담당자는 기술의 급속한 발전을 따라잡기 위해 끊임없이 지식을 학습하고 업데이트해야 합니다.

운영 및 유지 관리는 위험도가 높은 직업입니다. 서버를 죽이지 않았다면 운영 및 유지 관리의 수명이 완벽하지 않습니까?

고위험 직업을 이야기하면 운영과 유지보수는 당연히 하나로 꼽힐 수 있습니다. 많은 대기업에서도 수동 운영과 유지보수로 인한 다운타임 사고가 자주 발생합니다.

태평양석유회사 사이버공격(2021) : 2021년 5월, U.S. Pacific Petroleum Corporation이 랜섬웨어 공격을 받아 회사의 네트워크와 서버가 오작동하고 종료되었습니다. 보도에 따르면 이번 사건은 직원이 실수로 악성 링크를 열어 발생한 것으로 알려졌다.

GitLab 중단(2017): 2017년 1월 코드 호스팅 서비스 제공업체인 GitLab에서는 심각한 데이터 손실 사고가 발생하여 많은 고객의 데이터가 영구적으로 삭제되었습니다. GitLab의 이후 공식 성명에 따르면 이는 직원이 실수로 프로덕션 데이터베이스에서 파일을 삭제했기 때문에 발생했습니다.

Walmart 서버 중단(2019): 2019년 11월 미국 거대 소매업체인 Walmart의 서버가 한 시간 내에 여러 번 다운되어 회사의 웹사이트, 애플리케이션 및 결제 시스템이 제대로 작동하지 않게 되었습니다. 이번 사건은 직원이 정기 서버 점검을 하던 중 실수로 발생한 것으로 알려졌다.

Microsoft Azure 클라우드 서비스 중단(2020): 2020년 9월 Microsoft의 Azure 클라우드 서비스가 글로벌 중단을 경험하여 많은 고객의 애플리케이션과 서비스가 제대로 작동하지 않게 되었습니다. 이후 이번 사건은 네트워크 구성 오류로 인해 발생한 것으로 확인됐다.

운영 및 유지보수 역시 다양한 불가항력, 심지어 자연재해에 직면할 수 있습니다

필리핀 태풍(2013): 2013년 11월 필리핀은 1947년 이후 처음으로 강한 태풍을 만났습니다. . 태풍으로 인해 6,000명 이상의 사망자와 실종자가 발생했으며 국가 기반시설이 큰 피해를 입었습니다. 이번 재난으로 인해 필리핀의 많은 국제 기업의 데이터 센터와 서버가 중단되기도 했습니다.

U.S. 허리케인(2012): 2012년 10월 미국 동부 해안에 심각한 허리케인이 발생했습니다. 이 재해로 인해 대규모 정전, 통신 중단, 홍수가 발생했습니다. 또한 이번 재해로 인해 Amazon, Google, Netflix 등 일부 유명 기업과 서비스 제공업체의 데이터 센터와 서버가 중단되었습니다.

경력 개발 방향이 불분명하고 운영 및 유지 관리 업무가 직장에서 혼란에 빠지는 경우가 많습니다...‍‍‍

하드 스킬 부족은 운영 및 유지 관리 담당자가 직면한 가장 큰 문제일 수 있습니다. 기술이 계속 발전함에 따라 운영 및 유지 관리 작업에는 변화하는 시장 요구에 적응하기 위한 새로운 기술과 도구에 대한 지속적인 학습이 필요합니다. 그러나 수년 동안 운영 및 유지 관리 분야에 종사해 온 일부 사람들의 경우 자신의 기술이 시장 수요에 뒤처져 혼란스럽고 압도감을 ​​느낄 수 있습니다.

열악한 환경은 실제로 운영 및 유지 관리로 인한 것이 아닙니다. 다른 기술 분야에 비해 운영 및 유지 관리 분야의 경력 개발 경로는 상대적으로 모호합니다. 일부 조직에서는 운영 및 유지보수 엔지니어를 '물류 부서'로만 간주하고 다른 기술팀과 동등한 지위와 대우를 받지 못하는 경우가 많습니다. 이는 운영 및 유지 관리에 대한 부정적인 감정을 악화시켜 어느 정도 운영 및 유지 관리 엔지니어가 경력 개발 전망에 대해 불분명하게 만듭니다.

고개를 숙인 채 걷기만 하고 하늘을 올려다볼 시간이 없습니다. 운영 및 유지보수 작업의 본질은 시스템의 안정성과 신뢰성을 보장하는 것이므로 운영 및 유지보수 엔지니어는 항상 높은 수준의 경계심과 집중력을 유지해야 합니다. 이는 특히 시스템 오류나 긴급 상황에 직면할 때 매우 스트레스가 많은 직업으로 이어질 수 있습니다. 분주한 삶에 지쳐서 경력 개발의 미래에 대해 생각할 시간이 없습니다.

그렇다면 우리는 어떻게 하면 운영 및 유지보수 경력을 더 잘 발전시킬 수 있을지 자주 고민하게 됩니까? ‍‍

브라이언 페더스톤 하우(Brian Featherstone Howe)가 쓴 책 "비전(Vision)"은 직업의 보편적인 발전 법칙을 설명합니다. 여기에 언급된 원칙은 우리에게 답을 줄 수 있습니다.

10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다.

미래를 갖는다 45 45년과 같이 더 긴 기간 동안에는 현재 한 도시나 한 풀의 이익과 손실에 신경 쓰지 않을 것입니다. 그리고 명확한 진로 계획이 있으면 어려움을 극복하고 인내하는 것이 더 쉽습니다.

우리가 해야 할 일은 운영 및 유지 관리 기술의 개발 경로를 명확하게 하여 세분화된 기술 분야에서 최고의 성과를 거두는 것입니다

DevOps로의 전환: 어느 시점에서 소위 "DevOps는 죽었다"가 되었습니다. 기술계에서 인기 있는 인수. 그러나 DevOps는 결코 단순히 개발팀에게 운영과 유지관리를 하라고 요구하고, 운영과 유지관리는 갈 곳이 없게 놔두는 것이 아닙니다.

운영 및 유지 관리 작업이 이미 어렵습니다. 당황하지 마세요.

실제 DevOps에 필요한 구성 요소는 프로그래머가 스스로 처리해야 하거나 개발자가 운영 및 유지 관리 작업을 수행하도록 하는 분산된 오픈 소스 도구가 아닌 내부 DevOps 플랫폼과 내부 플랫폼을 유지 관리하기 위한 전담 팀이어야 합니다. 진정한 DevOps 팀은 개발, 운영, 유지 관리를 긴밀하게 통합하고 책임을 공유하며 IT 성능을 공동으로 개선하여 비즈니스 역량을 강화해야 합니다.

운영 및 유지 관리에서 DevOps로 전환하려면 운영 및 유지 관리 담당자가 지속적인 통합, 지속적인 전달, 자동화된 테스트, 컨테이너화 등과 같은 일부 핵심 도구와 기술을 숙달해야 합니다. 동시에 DevOps 팀은 다음과 같은 방법을 도입해야 합니다. 민첩한 개발, 반복 개발, 지속적인 전달 등이 있습니다. 완전한 DevOps 문화를 확립한 기업에서는 운영 및 유지 관리를 DevOps 작업으로 전환하는 것이 매우 좋은 개발 경로입니다.

AIOps로의 전환: 마찬가지로 AIOps는 항상 운영 및 유지 관리를 위한 좋은 경력 개발 경로였습니다. AIOps는 IT 운영 및 유지 관리 담당자가 로그 분석, 문제 해결 등과 같은 일상적이고 지루하며 가치가 낮은 작업을 자동화하여 보다 복잡한 문제를 해결하는 데 더 많은 시간과 에너지를 확보할 수 있도록 도와줍니다.

동시에 운영 및 유지 관리 작업에는 인프라 관리, 애플리케이션 배포, 모니터링, 문제 해결 등을 비롯한 여러 측면이 포함됩니다. 이러한 작업에는 운영 및 유지 관리 담당자의 전문 지식과 경험이 필요합니다.

AIOps 기술은 IT 운영의 효율성과 정확성을 향상시킬 수 있지만 인간 운영 인력의 업무를 완전히 대체하지는 않습니다. 대신, 그들은 함께 협력하여 전체 IT 운영 팀을 더욱 효율적이고 생산적으로 만듭니다.

SRE로의 전환: DevOps의 소프트웨어 개발 기술, 마스터 자동화 도구, 테스트, 배포 및 모니터링 방법을 지속적으로 학습합니다. 클라우드 컴퓨팅 및 컨테이너 기술을 배우려면 SRE는 클라우드 컴퓨팅 플랫폼 및 컨테이너 기술을 이해하고 AWS, Docker, Kubernetes 등과 같은 기본 클라우드 서비스 및 컨테이너 관리 도구를 마스터해야 합니다. 신뢰성, 자동화, 실험 문화 등 핵심 개념 등 조직 내 SRE 문화를 구축하는 동시에 데이터 분석 기술을 습득하세요.

위 내용은 10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제