집 >Java >Java인터뷰 질문들 >면접관: 높은 동시성에 대해 얼마나 알고 있나요? 나: 음...
높은 동시성은 거의 모든 프로그래머가 갖고 싶어하는 경험입니다. 이유는 간단합니다. 트래픽이 증가하면 인터페이스 응답 시간 초과, CPU 로드 증가, 빈번한 GC, 교착 상태, 대용량 데이터 저장 등 다양한 기술적 문제가 발생하게 됩니다. 이러한 문제는 우리가 지속적으로 개선하도록 유도할 수 있습니다. 우리의 기술적 깊이.
과거 인터뷰에서 후보자가 고도의 동시성 프로젝트를 수행한 경우, 주로 후보자에게 고도 동시성에 대한 이해에 대해 이야기해 달라고 요청하지만, 이 질문에 체계적으로 답할 수 있는 사람은 많지 않을 것입니다. 다음 카테고리:
1. 데이터 기반 지표의 개념 없음: 높은 동시성 시스템을 측정하기 위해 어떤 종류의 지표를 선택해야 할지 모르시나요? 동시성과 QPS의 차이를 알 수 없고, 내 시스템의 총 사용자 수, 활성 사용자 수, 플랫 타임과 피크 타임의 QPS 및 TPS, 기타 주요 데이터도 모릅니다.
2. 일부 계획이 설계되었지만 세부 사항이 완전히 파악되지 않았습니다. 주의해야 할 기술적 사항과 계획의 가능한 부작용을 말할 수 없습니다. 예를 들어 읽기 성능에 병목 현상이 발생하면 캐싱이 도입되지만 캐시 적중률, 핫키, 데이터 일관성 등의 문제는 무시됩니다. 3. 높은 동시성 설계와 성능 최적화를 동일시하는 일방적인 이해: 동시 프로그래밍, 다단계 캐싱, 비동기화 및 수평 확장에 대해 이야기하지만 고가용성 설계, 서비스 거버넌스 및 운영을 무시합니다. 유지 보수 보장. 4. 큰 계획을 마스터하지만 가장 기본적인 것은 무시합니다. 수직 레이어링, 수평 파티셔닝, 캐싱과 같은 큰 아이디어를 명확하게 설명할 수 있지만 데이터 구조를 분석할 수 있는 인식이 없습니다. 합리적이고 알고리즘이 효율적이든 아니든 저는 IO와 컴퓨팅의 가장 기본적인 두 가지 차원에서 세부 사항을 최적화하는 것에 대해 생각해 본 적이 없습니다. 이 글에서는 제가 가지고 있는 높은 동시성 프로젝트에서의 경험을 결합하여 높은 동시성에서 숙달해야 할 지식과 실무 아이디어를 체계적으로 정리하여 여러분께 도움이 되기를 바랍니다. 콘텐츠는 다음 3개 부분으로 구성됩니다. 높은 동시성은 대규모 트래픽을 의미하며, 트래픽의 영향에 저항하기 위해 기술적 수단을 사용해야 합니다. 이러한 수단은 트래픽을 운영하는 것과 같아서 시스템에서 트래픽을 보다 원활하게 처리하고 사용자에게 더 나은 경험을 제공할 수 있습니다. 일반적인 높은 동시성 시나리오에는 Taobao의 Double 11, 봄 축제 중 티켓 잡기, Weibo Vs의 최신 뉴스 등이 포함됩니다. 이러한 일반적인 것 외에도 초당 수십만 건의 요청을 처리하는 플래시 세일 시스템, 하루에 수천만 건의 주문을 처리하는 주문 시스템, 하루에 수억 건의 일일 활동을 처리하는 정보 흐름 시스템 등을 모두 분류할 수 있습니다. 높은 동시성으로. 분명히 위에서 언급한 높은 동시성 시나리오에서는 동시성의 양이 다릅니다. 그렇다면 얼마나 많은 동시성이 높은 동시성으로 간주됩니까? 1. 숫자만 볼 수는 없고 구체적인 비즈니스 시나리오를 살펴봐야 합니다. 10W QPS의 플래시 세일은 동시성이 높다고 할 수 없지만, 1W QPS의 정보 흐름은 동시성이 높지 않습니다. 정보 흐름 시나리오에는 복잡한 추천 모델과 다양한 수동 전략이 포함되며, 비즈니스 로직은 깜짝 세일 시나리오보다 10배 이상 복잡할 수 있습니다. 그러므로 같은 차원이 아니며, 비교의미도 없습니다. 2. 비즈니스는 0부터 1까지 구축됩니다. 동시성과 QPS는 참고 지표일 뿐입니다. 가장 중요한 것은 비즈니스 규모가 점차 10배가 될 때 사용합니까, 아니면 높은 동시성을 사용할 때 사용합니까? 처리 방법, 시스템을 발전시키는 방법, 아키텍처 설계, 코딩 구현 및 제품 솔루션 차원에서 높은 동시성으로 인해 발생하는 문제를 예방하고 해결하는 방법은 무엇입니까? 맹목적으로 하드웨어를 업그레이드하고 수평적 확장을 위해 기계를 추가하는 대신. 또한, 각 높은 동시성 시나리오의 비즈니스 특성은 완전히 다릅니다. 읽기는 많고 쓰기는 적은 정보 흐름 시나리오가 있고, 읽고 쓰기가 많은 거래 시나리오가 있습니다. 다양한 시나리오를 해결하기 위한 보편적인 기술 솔루션은 어떻습니까? 큰 아이디어와 다른 사람의 계획에서 배울 수 있다고 생각하지만, 실제 구현 과정에서는 세부 사항에 무수히 많은 함정이 있을 것입니다. 또한, 소프트웨어와 하드웨어 환경, 기술 스택, 제품 로직이 완전히 일관되지 않기 때문에 동일한 비즈니스 시나리오로 이어지더라도 동일한 기술 솔루션을 사용하더라도 다른 문제에 직면하게 되며 이러한 함정은 발생합니다. 하나씩 극복해 나가세요. 따라서 이 글에서는 높은 동시성에 대한 더 깊은 이해를 제공하기 위해 제가 실습한 기본 지식, 일반적인 아이디어 및 효과적인 경험에 중점을 둘 것입니다. 먼저 높은 동시성 시스템 설계의 목표를 명확히 한 다음, 의미 있고 타겟이 명확할 수 있도록 설계 계획과 실제 경험을 논의합니다. 높은 동시성이 단지 높은 성능을 추구한다는 의미는 아니며, 이는 많은 사람들의 일방적인 이해입니다. 거시적 관점에서 동시성 시스템 설계에는 높은성능, 고가용성, 높은 확장성이라는 세 가지 목표가 있습니다. 1. 고성능: 성능은 제한된 하드웨어 투자로 성능 향상은 비용을 의미합니다. 동시에 성능은 사용자 경험을 반영합니다. 응답 시간은 각각 100밀리초와 1초로 사용자에게 완전히 다른 느낌을 줍니다. 2. 고가용성 : 은 시스템이 정상적으로 서비스될 수 있는 시간을 나타냅니다. 하나는 일년 내내 가동 중지 시간이 없고 다른 하나는 때때로 온라인 사고가 발생하고 사용자는 확실히 전자를 선택할 것입니다. 게다가 시스템의 가용성이 90%에 불과하다면 비즈니스에 큰 지장을 초래할 것입니다. 3. 높은 확장성 : 시스템의 확장성을 나타냅니다. 트래픽이 가장 많은 시간대에 확장이 완료될 수 있는지, Double 11 이벤트와 같은 피크 트래픽을 보다 원활하게 처리할 수 있는지 여부 , 연예인 이혼 등 화끈한 이벤트 . 이 세 가지 목표는 상호 연관되어 있고 심지어 서로 영향을 미치기 때문에 종합적으로 고려해야 합니다. like 보다: 시스템의 확장성을 고려하고 서비스를 무상태로 설계합니다. , 이런 클러스터는 designdesign은 실제로 시스템의 성능과 유용성도 향상시킵니다. 또 다른 예: 가용성을 보장하기 위해 일반적으로 많은 수의 스레드가 느린 요청을 차단하고 시스템 사태를 일으키는 것을 방지하기 위해 서비스 인터페이스에 시간 초과가 설정됩니다. 그렇다면 합리적인 시간 초과 설정은 무엇입니까? 일반적으로 종속 서비스의 성능을 기반으로 설정을 수행합니다. 미시적 관점에서 고성능, 고가용성 및 높은 확장성을 측정하는 구체적인 지표는 무엇인가요? 이 지표를 선택한 이유는 무엇입니까? 성능 지표는 현재 성능 문제를 측정하고 성능 최적화를 위한 평가 기준으로 사용할 수 있습니다. 일반적으로 일정 기간 내의 인터페이스 응답 시간이 지표로 사용됩니다. 1. 평균 응답 시간: 가장 일반적으로 사용되지만 결함이 분명하며 느린 요청에 민감하지 않습니다. 예를 들어 10,000개의 요청이 있고 그 중 9,900개가 1ms이고 100개가 100ms라면 평균 응답 시간은 1.99ms입니다. 비록 평균 시간 소모는 0.99ms만 증가했지만 1% 요청에 대한 응답 시간은 100ms 증가했습니다. 타임스. 2, TP90, TP99 및 기타 분위수 값: TP90은 90번째 백분위수로 순위가 매겨진 응답 시간을 나타냅니다. 느린 요청. 3. 처리량: 응답 시간에 반비례합니다. 예를 들어 응답 시간이 1ms이면 처리량은 초당 1000회입니다. 일반적으로 성능 목표를 설정할 때 처리량과 응답 시간을 모두 고려합니다. 예를 들어 초당 요청 10,000개 미만, AVG는 50ms 미만, TP99는 100ms 미만으로 제어됩니다. 동시성이 높은 시스템의 경우 AVG 및 TP 분위수 값을 동시에 고려해야 합니다. 또한 사용자 경험의 관점에서 보면 200밀리초가 첫 번째 구분점으로 간주되어 사용자는 지연을 느끼지 않을 것이며 두 번째 구분점은 사용자가 지연을 느끼지만 허용됩니다. . 따라서 건강한 높은 동시성 시스템을 위해서는 TP99는 200ms 이내에 제어되어야 하고, TP999 또는 TP9999는 1초 이내에 제어되어야 합니다. 가용성은 시스템이 오류 없이 실행될 수 있는 능력이 높다는 것을 의미합니다. 가용성 = 가동 시간/총 시스템 실행 시간은 일반적으로 시스템을 설명하는 데 사용됩니다. . 고동시성 시스템의 경우 가장 기본적인 요구 사항은 3 9s 또는 4 9s를 보장하는 것입니다. 그 이유는 간단합니다. 9만 2개만 할 수 있다면 실패 시간은 1%라는 뜻입니다. 예를 들어 일부 대기업은 종종 GMV가 1,000억이 넘거나 매년 1%의 수익이 비즈니스에 미치는 영향을 의미합니다. 억 수준. 갑작스러운 트래픽에 직면하여 일시적으로 아키텍처를 변환하는 것은 불가능합니다. 가장 빠른 방법은 시스템의 처리 능력을 선형적으로 향상시키기 위해 머신을 추가하는 것입니다. 비즈니스 클러스터나 기본 구성 요소의 경우 확장성 = 성능 향상 비율 / 머신 추가 비율이 이상적인 확장성은 리소스를 여러 번 늘리고 성능을 여러 번 향상시키는 것입니다. 일반적으로 확장능력은 70% 이상을 유지해야 합니다. 그러나 높은 동시성 시스템의 전체 아키텍처 관점에서 볼 때 확장의 목표는 단지 서비스를 무상태로 설계하는 것이 아닙니다. 트래픽이 10배 증가하면 비즈니스 서비스는 10배로 빠르게 확장할 수 있지만 데이터베이스는 새로운 병목 현상이 발생할 수 있습니다. MySQL과 같은 상태 저장 서비스는 일반적으로 기술적으로 확장하기 어렵습니다. 아키텍처가 사전에 계획되지 않은 경우(수직 및 수평 분할) 대량의 데이터 마이그레이션이 필요합니다. 따라서 높은 확장성을 고려해야 합니다: 서비스 클러스터, 데이터베이스, 캐시 및 메시지 큐와 같은 미들웨어, 로드 밸런싱, 대역폭, 종속 타사 등. 동시성이 특정 수준에 도달하면 위의 각 요소는 확장에 병목 현상이 발생할 수 있습니다. 단일 머신의 처리 능력을 향상시키는 것이 목표이며, 계획에는 다음도 포함됩니다. 단일 머신 성능에는 항상 한계가 있기 때문에 궁극적으로 수평 확장을 도입하고 클러스터 배포를 통해 동시 처리 기능을 더욱 향상시키는 것이 필요합니다. 다음 두 가지 방향을 따릅니다. : 1. 계층적 아키텍처 개발: 이는 수평적 확장을 위한 진보입니다. 왜냐하면 높은 동시성 시스템에는 종종 복잡한 비즈니스가 있고 계층화된 처리를 통해 복잡한 문제를 단순화하고 수평적 확장을 더 쉽게 달성할 수 있기 때문입니다. 위 그림은 인터넷의 가장 일반적인 계층형 아키텍처입니다. 물론 실제 높은 동시성 시스템 아키텍처는 이를 기반으로 더욱 향상됩니다. 예를 들어, 동적 및 정적 분리가 이루어지고 CDN이 도입될 것입니다. 리버스 프록시 레이어는 LVS+Nginx가 될 수 있고, 웹 레이어는 통합 API 게이트웨이가 될 수 있으며, 비즈니스 서비스 레이어는 수직적 비즈니스에 따라 추가로 마이크로서비스될 수 있습니다. , 저장 계층은 다양한 이기종 데이터베이스가 될 수 있습니다. 2. 각 레이어의 수평 확장: 상태 비저장 수평 확장, 상태 저장 샤드 라우팅. 비즈니스 클러스터는 일반적으로 상태 비저장으로 설계될 수 있지만 데이터베이스와 캐시는 상태 저장이 되는 경우가 많습니다. 따라서 파티션 키는 스토리지 샤딩을 위해 설계되어야 합니다. 물론 마스터-슬레이브 동기화 및 읽기-쓰기 분리를 통해 읽기 성능도 향상될 수 있습니다. 1, 클러스터 배포, 로드 밸런싱을 통해 단일 시스템에 대한 부담을 줄입니다. 위 솔루션은 컴퓨팅과 IO의 두 가지 차원에서 가능한 모든 최적화 지점을 고려한 것에 지나지 않습니다. 현재 성능을 실시간으로 이해하고 성능 병목 현상 분석을 수행할 수 있도록 지원하는 모니터링 시스템이 필요합니다. 그런 다음 28가지 원칙을 따르고 주요 모순을 파악하고 최적화합니다. 1. 피어 노드의 장애 조치 Nginx와 서비스 거버넌스 프레임워크는 하나의 노드가 실패한 후 다른 노드에 대한 액세스를 지원합니다. 고가용성 솔루션은 주로 중복성, 절충, 시스템 운영 및 유지 관리의 세 가지 방향에서 고려됩니다. 동시에 온라인 문제가 발생할 경우 지원 의무 메커니즘과 오류 처리 프로세스가 필요합니다. 시간 내에 후속 조치를 취할 수 있습니다. 1. 합리적인 계층형 아키텍처: 예를 들어 위에서 언급한 인터넷에서 가장 일반적인 계층형 아키텍처는 또한 데이터 액세스 계층 및 비즈니스 로직 계층 마이크로서비스는 보다 세분화된 방식으로 계층화됩니다(그러나 네트워크에 홉이 하나 더 있을 수 있으므로 성능을 평가해야 합니다). 높은 동시성은 제한된 공간으로 인해 분산 추적, 전체 링크 스트레스 테스트 및 유연한 트랜잭션과 같은 기술적 사항을 고려해야 합니다. 또한, 비즈니스 시나리오가 다르면 동시성 구현 솔루션도 달라지겠지만 전체적인 디자인 아이디어와 참고할 수 있는 솔루션은 기본적으로 유사합니다. 고동시성 디자인은 또한 건축 디자인의 세 가지 원칙인 단순성, 적절성 및 진화를 준수해야 합니다. "성급한 최적화는 만악의 근원이다", 사업의 실제 상황과 분리될 수 없으며, 과도하게 설계하지 마세요 , 적절한 솔루션이 가장 완벽합니다. 이 글을 통해 높은 동시성에 대한 보다 포괄적인 이해가 되기를 바랍니다. 또한 배울 수 있는 경험과 깊이 있는 생각이 있다면 토론을 위해 댓글 영역에 메시지를 남겨주세요.
❇ 성능 지표
❇ 가용성Indicator
❇ 확장성Indicator
❇수직 확장(scale-up)
❇ 수평적 확장(scale-out)
❇ 고성능 실용적인 솔루션
❇ 고가용성 실용적인 솔루션
❇ 확장성이 뛰어난 실용적인 솔루션
위 내용은 면접관: 높은 동시성에 대해 얼마나 알고 있나요? 나: 음...의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!