이 기사는 InfoQ 중국 방송국에 처음 게재되었습니다. 저자: Ming Ling (dragon), Fenng. 참고: 재인쇄를 원하는 친구들은 이 글의 첫 번째 저자를 주목해주세요!
이 글은 드래곤의 친구가 토론을 위해 이메일을 보낸 후 작성한 요약입니다. DB나 애플리케이션에서의 정렬은 매우 흥미로운 주제입니다. 실제로 Dragon은 첫 번째 이메일에서 이를 매우 잘 요약했습니다. 이제 그것을 올려서 모든 사람과 공유해 보세요. 이 글은 InfoQ 중국역에도 투고되었습니다.
Q: PHP에서 정렬을 수행하는 것이 MYSQL에서 정렬하는 것보다 나은 이유를 나열해 보세요. MYSQL에서 정렬을 수행해야 하는 몇 가지 예를 들어보시겠습니까?
A: 일반적으로 실행 효율성은 CPU, 메모리, 하드 디스크의 부하를 고려해야 합니다. MYSQL 서버와 PHP 서버가 가장 적합한 방식으로 구성되어 있다고 가정하면 시스템은 다음과 같습니다. 확장성과 사용자가 인지하는 성능은 우리가 추구하는 주요 목표입니다. 실제 작업에서 MYSQL의 데이터는 HASH 테이블, BTREE 등의 메모리에 저장되는 경우가 많으며 동시에 작업 속도도 매우 빠릅니다. INDEX는 이미 많은 응용 프로그램에서 일부 사전 정렬을 수행했습니다. 첫 번째 선택. 애플리케이션 계층(PHP)에서의 정렬도 메모리에서 수행되어야 하며 MYSQL과 비교하여 다음과 같은 장점이 있습니다.
- 1. 애플리케이션에서 전체 웹사이트의 확장성과 전반적인 성능을 고려합니다. 레이어 정렬(PHP)은 데이터베이스의 부하를 확실히 줄여 전체 웹사이트의 확장성을 향상시킵니다. 실제로 데이터베이스의 정렬 비용은 매우 높아서 메모리와 CPU를 소모하게 됩니다. 동시 정렬이 많으면 DB에 병목 현상이 발생하기 쉽습니다.
- 2. 애플리케이션 계층(PHP)과 MYSQL 사이에 데이터 중간 계층이 있고 이를 적절히 활용하면 PHP가 더 나은 이점을 얻을 수 있습니다.
- 3. PHP의 메모리 내 데이터 구조는 특정 애플리케이션을 위해 특별히 설계되었으며 데이터베이스보다 더 간결하고 효율적입니다.
- 4. PHP는 데이터 재해 복구 문제를 고려할 필요가 없으며 이 부분의 운영 손실을 줄일 수 있습니다.
- 5. PHP에는 테이블 잠금 문제가 없습니다.
- 6. MYSQL에서는 정렬, 요청 및 결과 반환도 네트워크 연결을 통해 수행되어야 하지만, PHP에서는 정렬 후 바로 반환할 수 있어 네트워크 IO가 줄어듭니다.
실행 속도는 애플리케이션 설계에 문제가 있어 불필요한 네트워크 IO가 많이 발생하지 않는 한 차이가 크지 않아야 합니다. 또한, 애플리케이션 계층에서는 PHP의 Cache 설정에 주의해야 하며, 이를 초과하면 내부 오류가 보고되므로 애플리케이션에 따라 Cache를 평가하거나 조정해야 합니다. 구체적인 선택은 특정 애플리케이션에 따라 달라집니다.
PHP에서 정렬하는 것이 더 나은 상황을 나열합니다:
- 1. 데이터 소스가 MYSQL에 없지만 하드 디스크, 메모리 또는 네트워크 요청에 존재합니다. ;
- 2. 데이터는 MYSQL에 저장되어 있고, 그 양이 크지 않으며, 해당 인덱스가 없습니다. 이때 데이터를 꺼내서 PHP로 정렬하는 것이 더 빠릅니다.
- 3. 데이터 소스는 여러 MYSQL 서버에서 제공됩니다. 이때 여러 MYSQL에서 데이터를 검색한 다음 PHP로 정렬하는 것이 더 빠릅니다.
- 4. MYSQL 외에도 하드디스크, 메모리, 네트워크 요청 등 다른 데이터 소스가 있는데, 이때 이러한 데이터를 MYSQL에 저장한 후 정렬하는 것은 적합하지 않습니다.
열 다음은 MYSQL에서 정렬해야 하는 몇 가지 예입니다.
1. 이 정렬된 인덱스는 MYSQL에 이미 존재합니다.
- 2. MYSQL의 데이터 양은 많고 결과 집합에는 매우 작은 하위 집합이 필요합니다. 예를 들어 1,000,000개의 데이터 행이 있는 경우 TOP 10을 선택합니다.
- 3. 여러 서비스에 제공할 수 있는 통계 집계와 같이 한 번의 정렬과 여러 번의 호출이 필요한 상황에서는 MYSQL에서의 정렬이 선호됩니다. 또한 심층 데이터 마이닝의 경우 일반적인 접근 방식은 애플리케이션 계층에서 정렬과 같은 복잡한 작업을 완료한 다음 결과를 쉽게 여러 번 사용할 수 있도록 MYSQL에 저장하는 것입니다.
- 4. 데이터 소스가 어디인지에 관계없이 데이터의 양이 일정 규모에 도달하면 이 시점에서 차지하는 메모리/캐시로 인해 더 이상 PHP 정렬에 적합하지 않습니다. MYSQL로 복사, 가져오기 또는 저장해야 하며 INDEX 최적화를 사용하는 것이 PHP
- 보다 낫습니다. 그러나 이러한 작업을 Java 또는 C에서 처리하는 것이 더 좋습니다. [대규모 데이터 세트의 집계 또는 요약과 유사한 일부 데이터는 클라이언트 측 정렬이 이득과 손실보다 더 큽니다. 물론, 검색 엔진과 유사한 아이디어를 사용하여 유사한 응용 상황을 해결할 수도 있습니다. ]
웹사이트의 전반적인 고려사항에는 인력, 비용 등의 고려사항이 반드시 포함되어야 합니다. 웹사이트의 규모와 로드가 작고, 인력이 제한되어 있는 경우(인원과 능력이 제한될 수 있음), 애플리케이션 계층(PHP)에서 정렬하려면 많은 개발 및 디버깅 작업이 필요하므로 시간이 많이 걸리고 비용이 많이 들지 않습니다. 손실의 가치가 있으며 간단하고 빠르게 처리하는 것이 좋습니다. 대규모 웹 사이트의 경우 전력 및 서버 비용이 매우 높습니다. 시스템 아키텍처를 신중하게 계획하면 회사의 지속 가능한 발전에 필요한 많은 비용을 절약할 수 있습니다. 이때 애플리케이션 계층(PHP
)이 가능하다면 말이죠. 정렬되고 충족되어야 합니다. 비즈니스 요구 사항은 가능한 한 애플리케이션 계층에서 구현되어야 합니다.
위 내용은 임시 인터넷 파일의 내용을 포함하여 PHP에서의 임시 인터넷 파일 정렬과 MySQL에서의 정렬에 대해 소개하고 있으며, PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.