소개 | 많은 시스템, 특히 IT 시스템이나 일부 전력 시스템 및 통신 시스템이 연중무휴로 작동하기 때문입니다. 결함이 발생하면 당사의 운영 및 유지보수 담당자는 신속하게 결함을 찾아 신속하고 경제적으로 결함을 해결해야 합니다. 예를 들어 수술을 지원하는 병원의 일부 시스템은 오작동을 신속하게 해결하지 못할 경우 환자의 생명을 위협할 수도 있습니다. 따라서 문제 해결은 운영 및 유지 관리 담당자에게 매우 중요한 기술이자 기술 요구 사항입니다. |
문제 해결은 문제의 근본 원인을 찾아 해결하는 프로세스입니다. 문제 해결의 목표는 장치/시스템을 정상적인 작동 상태로 되돌리는 것입니다.
많은 시스템, 특히 IT 시스템이나 일부 전력 시스템 및 통신 시스템이 연중무휴로 작동하기 때문입니다. 결함이 발생하면 당사의 운영 및 유지보수 담당자는 신속하게 결함을 찾아 신속하고 경제적으로 결함을 해결해야 합니다. 예를 들어 수술을 지원하는 병원의 일부 시스템은 오작동을 신속하게 해결하지 못할 경우 환자의 생명을 위협할 수도 있습니다. 따라서 문제 해결은 운영 및 유지 관리 담당자에게 매우 중요한 기술이자 기술 요구 사항입니다.
문제 해결은 직장뿐만 아니라 생활에서도 필요합니다. 얼마 전 친구와 함께 Honor of Kings를 플레이하던 중 오류가 발생했습니다. 매일 밤 8시나 9시가 되면 이 게임을 할 때마다 네트워크 품질이 저하되고 동작이 매우 느려집니다. 운영 및 유지보수 담당자로서, 혹은 기술직의 본능으로서, 네트워크에 무슨 문제가 있는 것인지 매우 고민스럽습니다. 어떻게 고치나요? 그래서 문제 해결 과정을 거쳤습니다. 집에 있는 모든 무선 네트워크와 China Unicom의 광대역에서 몇 가지 테스트를 수행하고 무선 라우터의 구성을 최적화하려고 시도했습니다. 마지막으로 우리 집과 이웃 근처의 2.4G 채널이 너무 혼잡하고 간섭이 너무 심각한 것으로 확인되었습니다. , 그래서 저녁 출퇴근 시간에는 모든 사람이 인터넷을 필요로 하고 서로 방해하게 됩니다. 나중에는 5G로 채널을 바꾸니까 세상이 조용해지고, 안심하고 게임을 할 수 있었어요.
문제 해결을 위한 일반적인 접근 방식그러고보니 과연 아주 과학적이고 표준화된 과정이나 방법이 있을까? 이 방법을 차근차근 따라하면 어떤 결점이나 문제도 해결될 수 있지 않을까? 문제가 다양하지만 실제 문제 해결 방법도 다양하며, 특정 시나리오와 문제에 대해 구체적인 문제 해결 프로세스를 개발할 수 있습니다. 특정 작업에서 일부는 SA를 수행하고 일부는 네트워크를 수행하며 일부는 DBA를 수행합니다. 각 특정 방향에는 직업 및 문제 시나리오와 관련된 몇 가지 문제 해결 방법이 있습니다.
일반적인 문제의 경우 따를 수 있는 일반적인 해결 방법과 단계가 있나요?
이것은 "Cisco IP 네트워크 문제 해결 및 유지"라는 책의 저자가 요약한 비교적 일반적인 방법입니다. 그는 전체 문제 해결 과정을 문제 정의부터 단서와 정보 수집, 분석, 가설, 가능성 제거, 최종 해결까지 7단계로 나누었습니다.
일부 복잡한 시스템이나 복잡한 문제를 해결할 때 이 솔루션 프로세스에 따라 문제를 추상화하고 정의한 다음 단계별로 해결할 수 있습니다.
구체적인 전략과 기술이 표준 프로세스 및 방법 외에도 상대적으로 간단하거나 보다 직관적인 문제가 발생할 수 있으며, 보다 신속하게 문제를 해결하기 위해 몇 가지 구체적인 전략과 팁을 사용할 수 있습니다.
전제 조건 문제 해결스위치를 눌렀을 때 TV가 응답하지 않는 문제가 자주 발생합니까? 컴퓨터가 켜지지 않는 이유는 무엇입니까? 이 문제는 전원 공급 장치가 연결되어 있지 않거나 정전이 발생했을 가능성이 매우 높습니다. 이 문제에서 파생된 모든 시스템은 작동하기 위해 몇 가지 필수 전제 조건 또는 전제 조건이 필요합니다. 시스템이나 서비스에 이상이 발생하면 다시 돌아가서 시스템이 어떤 종속성을 갖고 있는지, 어떤 전제조건을 가지고 있는지 파악해야 합니다. 이전에는 이러한 조건이 존재했고 정상이었는데 지금은 조건이 충족되지 않아 일부 장애가 발생했습니다. .
예를 들어, 운전 중에 오토바이가 움직이지 않는다면 휘발유가 부족한 것인가요? iPhone과 같이 매우 성숙하거나 잘 상용화된 일부 제품의 경우 사용 설명서에는 정상적인 작동 조건과 고온 및 저온 등 피해야 할 조건이 나열되어 있으며 매우 명확하게 설명되어 있습니다. . 정의.
그러나 일부 자체 개발 시스템의 운영 및 유지 관리 과정에서는 이러한 시스템의 문서 및 지침이 특별히 완전하지 않은 경우가 많기 때문에 시스템 이상이나 문제를 기반으로 전제 조건을 조사해야 하는 경우도 있습니다. R&D 담당자나 설계자에게 연락하여 시스템의 전제 조건을 알아낸 다음 이를 문제 해결의 단서로 사용하십시오. 이것이 가장 기본적인 문제 해결 방법입니다. 모두가 비슷한 문제를 해결했으며, 대부분의 문제는 우리의 경험과 직관이 해결하는 데 도움이 될 수 있는 매우 일반적인 원인으로 인해 발생하는 경우가 많습니다.
가장 효율적인 시스템다음 문제 해결 전략으로 넘어가겠습니다. 컴퓨터 설치 경험이 있는 분 계시나요? 컴퓨터 시스템에는 CPU, 메모리, 전원 공급 장치, 섀시, 모니터, 광학 드라이브, 마우스, 오디오, 네트워크 카드 등과 같은 많은 구성 요소가 있습니다. 컴퓨터를 설치할 때 한 번에 모두 설치할 필요는 없으며 전원 공급 장치, 마더보드, CPU 및 메모리를 설치한 다음 시스템이 정상적으로 작동하는지 테스트해 보는 경우가 많습니다. 시스템에 불이 들어오면 시스템의 가장 중요한 구성 요소가 정상이라는 의미입니다. 따라서 문제 해결의 관점에서 오류를 찾을 때 많은 기능과 구성 요소가 포함된 매우 복잡한 시스템을 가장 기본적인 시스템으로 간소화하려고 시도할 수 있으며, 테스트가 성공한 후에는 다른 시스템 구성 요소를 하나씩 제거할 수 있습니다. 이를 통해 절반의 노력으로 두 배의 결과로 이 문제를 찾아 해결할 수 있습니다.
기본 상태로 복원/다시 시작다른 시나리오도 첫 번째 시나리오와 유사합니다. 오랫동안 실행한 후 시스템이 정상적으로 작동하지 않습니다. 어떻게 해결하나요? 재시작. 이전 회사에서는 중요한 시스템을 휴일 전에 점검해야 한다는 암묵적인 규칙이 있었습니다. 특정 기간 동안 시스템을 다시 시작하지 않으면 시스템의 장기간 작동으로 인한 비정상적인 상태를 방지하기 위해 계획된 다시 시작을 마련했습니다. .
따라서 일부 재시작 솔루션을 사용하여 오류를 시스템의 초기 상태로 복원하고 오류를 해결할 수 있습니다. 이는 매우 강력한 오류 해결 방법입니다. 물론 다시 시작하기 전에 더 나쁜 결과를 초래할 수 있는 시작 실패 등 예상치 못한 결과를 고려해야 합니다. 재부팅 외에도 시스템을 재설치/재구축하여 기본 시스템 또는 작업 시스템의 복사본을 만들 수도 있습니다.
한 번에 하나의 구성 요소만 교체하세요분석과 위치를 통해 특정 하위 시스템이나 특정 모듈에서 오류가 발생할 수 있다는 사실을 발견한 경우 문제를 빠르게 찾을 수 있는 방법이 있습니까? 부품 중 하나를 교체하고 테스트해 볼 수 있습니다. 이 방법을 사용하면 문제 해결을 통해 단계별로 결함 지점을 정확하게 찾아 해결할 수 있습니다. 이는 향후 유사한 문제에 직면할 때 귀중한 경험을 제공합니다. 이 방법을 사용하는 과정에서 한 번에 하나의 구성 요소만 교체된다는 점에 유의하는 것이 중요합니다. 테스트가 완료된 후 다른 구성 요소를 교체해야 하는 경우 먼저 이전 변경 사항을 원래 상태로 복원해야 합니다. 그렇지 않으면 변경으로 인해 여러 가지 문제가 발생하여 문제 해결에 영향을 미치고 방해할 수 있습니다.
마지막에 작성문제 해결은 과학이자 예술입니다. 또한 문제 재현, 시작 및 구성 순서 변경 등을 시도할 수도 있습니다. 실제로는 시간, 리소스, 시나리오 조건 및 제한 사항에 따라 가장 적합한 전략을 선택하여 문제 해결을 완료합니다. 문제를 해결해 보세요.
저자 소개Teng Chuanyong, Meituan 클라우드 설계자. Baidu 및 eBay에서 시스템 및 서비스 운영 및 유지 관리 업무를 담당했으며, 기본 서비스 운영 및 유지 관리, 대규모 시스템 배포 및 최적화, 가상화 등을 담당하고 있습니다. 2012년 메이투안에 합류해 운영 및 유지보수 업무를 담당하고 있으며, 주로 기본 서비스 운영 및 유지관리, 데이터센터 및 네트워크 구축, 클라우드 컴퓨팅 환경 구축 및 운영 및 유지관리 등을 담당하고 있다.
글은 WeChat 공개 계정에서 가져온 것입니다: 효율적인 개발과 운영 및 유지 보수
위 내용은 기술 인력을 위한 필수 기술: 문제 해결 방법론 - 문제 해결의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!