집 >일반적인 문제 >10분만에 해결되는 대규모 분산형 전자상거래 시스템 아키텍처 |

10분만에 해결되는 대규모 분산형 전자상거래 시스템 아키텍처 |

Java后端技术全栈앞으로: 2023-08-23 15:03:021022검색

이 글은 대규모 분산 웹사이트 아키텍처 학습에 대한 기술적 요약입니다. 고성능, 고가용성, 확장 가능한 분산 웹사이트의 아키텍처에 대한 간략한 설명과 아키텍처 참조가 제공됩니다. 글의 일부는 독서 노트이고, 일부는 개인적인 경험을 요약한 것으로 대규모 분산 웹사이트 아키텍처에 좋은 참고 가치가 있습니다.

대규모 분산 웹사이트 아키텍처 기술

1. 대규모 웹사이트의 특징

다수 사용자, 폭넓은 배포
대규모 트래픽, 높은 동시성
대용량 데이터, 서비스 고가용성
보안 환경이 열악하고 네트워크 공격에 취약
다양한 기능, 빠른 개발, 잦은 출시
소규모에서 대규모로 점진적으로 발전
사용자- 중심
무료 서비스, 유료 경험

2. 대규모 웹사이트 아키텍처 목표

고성능: 빠른 액세스 경험을 제공합니다.
고가용성: 웹사이트 서비스는 항상 정상적으로 접속 가능합니다.
확장 가능: 하드웨어를 통해 처리 능력을 증가/감소, 증가/감소시킵니다.
보안: 웹사이트 보안 액세스 및 데이터 암호화, 보안 저장 및 기타 전략을 제공합니다.
확장성: 새로운 기능/모듈을 편리하게 추가/제거할 수 있습니다.
민첩성: 주문형, 빠른 응답

3. 대규모 웹사이트 아키텍처 모델

레이어링: 일반적으로 애플리케이션 계층과 서비스 계층으로 나눌 수 있습니다. , 데이터 계층, 관리 계층 및 분석 계층
세분화: 일반적으로 비즈니스/모듈/기능 특성에 따라 구분됩니다. 예를 들어 애플리케이션 계층은 홈페이지와 사용자 센터로 구분됩니다.
분산: 애플리케이션을 별도로 배포하고(예: 여러 물리적 시스템) 원격 호출을 통해 함께 작업합니다.
클러스터: 애플리케이션/모듈/기능은 로드 밸런싱을 통해 외부 액세스를 제공하기 위해 여러 복사본(예: 여러 물리적 시스템)에 배포됩니다.
캐싱: 액세스 속도를 높이기 위해 애플리케이션이나 사용자에 가장 가까운 데이터를 배치합니다.
비동기: 동기 작업을 비동기화합니다. 클라이언트는 서버가 응답할 때까지 기다리지 않고 요청을 보냅니다. 서버는 처리를 완료한 후 알림이나 폴링을 사용하여 요청자에게 알립니다. 일반적으로 요청-응답-알림 모드를 나타냅니다.
중복성: 복제본을 늘려 가용성, 보안 및 성능을 향상합니다.
보안: 알려진 문제에 대한 효과적인 솔루션을 확보하고 알려지지 않은/잠재적인 문제에 대한 검색 및 방어 메커니즘을 구축합니다.
자동화: 기계를 사용하여 도구를 통해 사람의 개입이 필요하지 않은 반복적인 작업을 완료합니다.
민첩성: 요구 사항의 변화를 적극적으로 수용하고 비즈니스 개발 요구 사항에 신속하게 대응합니다.

4. 고성능 아키텍처

는 사용자 중심이며 빠른 웹 액세스 경험을 제공합니다. 주요 매개변수는 짧은 응답 시간, 대규모 동시 처리 능력, 높은 처리량 및 안정적인 성능 매개변수입니다.

프론트엔드 최적화, 애플리케이션 계층 최적화, 코드 계층 최적화, 스토리지 계층 최적화로 나눌 수 있습니다.

프런트 엔드 최적화: 웹사이트 비즈니스 로직 이전 부분
브라우저 최적화: HTTP 요청 수 감소, 브라우저 캐시 사용, 압축 활성화, CSS JS 위치, JS 비동기, 쿠키 전송 감소; 가속, 역방향 프록시;
애플리케이션 계층 최적화: 웹사이트 비즈니스를 처리하는 서버. 캐시 사용, 비동기식, 클러스터
코드 최적화: 합리적인 아키텍처, 멀티스레딩, 리소스 재사용(개체 풀, 스레드 풀 등), 우수한 데이터 구조, JVM 튜닝, 싱글톤, 캐시 등;
스토리지 최적화: 캐시, 솔리드 스테이트 드라이브, 광섬유 전송, 최적화된 읽기 및 쓰기, 디스크 중복성, 분산 스토리지(HDFS), NoSQL 등

5. 고가용성 아키텍처

대규모 웹사이트는 항상 접근 가능해야 하며 정상적인 외부 서비스를 제공해야 합니다. 대규모 웹사이트의 복잡성, 분산, 저렴한 서버, 오픈소스 데이터베이스, 운영 체제 및 기타 특성으로 인해 고가용성을 보장하기 어렵습니다. 이는 웹사이트 장애가 불가피하다는 것을 의미합니다.

사용성을 어떻게 개선할 것인가는 시급히 해결해야 할 문제입니다. 우선 아키텍처 수준에서 고려하고, 계획 시 가용성을 고려해야 합니다. 업계에서는 가용성 지표를 나타내는 데 일반적으로 4개의 9(99.99)와 같이 몇 개의 9를 사용하며, 1년에 허용되는 비가용 시간은 53분입니다.

다양한 수준에서 다양한 전략이 사용됩니다. 중복 백업 및 장애 조치는 일반적으로 고가용성 문제를 해결하는 데 사용됩니다.

애플리케이션 계층: 일반적으로 상태 비저장으로 설계되어 각 요청을 처리하는 데 사용되는 서버에 영향을 미치지 않습니다. 일반적으로 고가용성을 달성하기 위해 세션 동기화 문제를 해결해야 하는 로드 밸런싱 기술이 사용됩니다.
서비스 계층: 로드 밸런싱, 계층적 관리, 빠른 실패(시간 초과 설정), 비동기 호출, 서비스 저하, 멱등성 설계 등
데이터 계층: 중복 백업(콜드, 핫 백업[동기, 비동기], 웜 백업), 장애 조치(확인, 전송, 복구). 높은 데이터 가용성에 대한 유명한 이론적 근거는 CAP 이론(지속성, 가용성, 데이터 일관성[강한 일관성, 사용자 일관성, 최종 일관성])입니다.