집 >백엔드 개발 >PHP 문제 >PHP는 차이점 세트와 대규모 배열 메모리 오버플로를 발견했습니다.

PHP는 차이점 세트와 대규모 배열 메모리 오버플로를 발견했습니다.

王林원래의: 2023-05-22 19:27:06623검색

PHP 개발에서는 대규모 배열을 처리할 때 메모리 문제가 발생하기 쉽습니다. 이 기사에서는 array_diff 알고리즘을 사용하여 거대한 배열의 차이점을 해결하는 방법에 대해 설명합니다. 또한, 대규모 배열로 작업할 때 성능을 최적화하기 위해 다양한 메모리 관리 기술을 사용하는 방법을 배우게 됩니다.

1. 문제 설명

시나리오를 생각해 보세요. 두 개의 배열이 있고 둘 다 매우 크고 각 배열에는 100,000개의 요소가 있습니다. 이제 우리는 이 두 배열의 차이점을 찾고 싶습니다. 쉽게 말하면 배열에만 존재하는 요소를 찾는 것입니다. 다음은 코드 구현입니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1，2，每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 计算差集
$result = array_diff($array1, $array2);

print_r($result);
?>

위 코드를 실행하면 페이지가 빠르게 응답하지 않게 되고 PHP 스크립트에 할당 가능한 메모리가 부족하다는 오류가 보고됩니다. 이는 PHP의 기본 메모리 제한이 128MB로 대규모 배열을 처리할 만큼 크지 않기 때문입니다. 따라서 이 문제를 해결하려면 최적화 알고리즘이나 기타 메모리 관리 기술을 고려해야 합니다.

2. 최적화 알고리즘

배열의 요소가 이미 순서대로 정렬되어 있는 경우 커서를 사용하면 검색 속도를 높일 수 있어 실행 시간과 메모리 사용량을 줄일 수 있습니다. 코드 구현은 다음과 같습니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1，2，每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 排序数组1、2
sort($array1);
sort($array2);

// 初始化游标
$cursor1 = $cursor2 = 0;

// 计算差集
$result = array();
while($cursor1 < count($array1) && $cursor2 < count($array2)){
    if($array1[$cursor1] < $array2[$cursor2]){
        $result[] = $array1[$cursor1];
        $cursor1++;
    }
    elseif($array1[$cursor1] > $array2[$cursor2]){
        $cursor2++;
    }
    else{
        $cursor1++;
        $cursor2++;
    }
}

// 将数组1中剩余的元素添加入结果数组
while($cursor1 < count($array1)){
    $result[] = $array1[$cursor1];
    $cursor1++;
}

print_r($result);
?>

위 코드는 실행 시간을 최적화하고 메모리 사용을 더욱 효율적으로 만듭니다. 그러나 배열이 순서대로 되어 있지 않으면 이 알고리즘은 작동하지 않습니다.

3. 분할 처리 기술 사용

PHP에서 array_diff는 대규모 배열을 처리할 때 매우 큰 메모리 오버헤드를 사용합니다. 그러나 PHP의 메모리 관리자는 각 메모리 할당에 대한 메모리 할당 테이블을 유지 관리합니다. 이 테이블은 각 메모리 할당의 크기와 위치를 감지합니다. 따라서 분할 처리 기술을 사용하면 큰 배열을 여러 개의 작은 하위 배열로 나누고 각 하위 배열을 별도로 처리하여 너무 많은 메모리 공간을 차지하지 않도록 할 수 있습니다. 코드 구현은 다음과 같습니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1，2，每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 分段，每段 10000 个元素
$chunkSize = 10000;
$chunks1 = array_chunk($array1, $chunkSize);
$chunks2 = array_chunk($array2, $chunkSize);

// 计算差集
$result = array();
foreach($chunks1 as $chunk1){
    $temp = array_diff($chunk1, array_merge(...$chunks2));
    $result = array_merge($result,$temp);
}

print_r($result);
?>

위 코드에서는 배열을 10000 크기의 여러 하위 배열로 나누어서 Chunks1 및 Chunks2 배열에 저장합니다. 그런 다음 Chunk1을 반복하고 array_diff를 사용하여 각 하위 배열과 Chunk2 사이의 차이를 계산한 다음 결과를 $result 결과 배열에 추가합니다. 마지막으로 $result를 최종 결과에 병합합니다.

4. 생성기를 사용하여 순회 알고리즘 시뮬레이션

대형 배열의 메모리 문제를 해결하는 또 다른 방법은 PHP의 생성기를 사용하여 두 배열 간의 차이를 찾는 순회를 시뮬레이션하는 것입니다. PHP의 생성기를 사용하면 전체 시퀀스를 메모리에 구축하는 대신 시퀀스에서 하나씩 값을 생성할 수 있습니다. 다음은 코드 구현입니다.

<?php
$array1 = array();
$array2 = array();

// 初始化数组1，2，每个数组都有 10 万个元素
for($i=0;$i<1000000;$i++){
    $array1[$i] = $i;
    $array2[$i] = $i+1;
}

// 计算差集
$result = array();
function diff($arr1, $arr2) {
    sort($arr1);
    sort($arr2);
    $i = $j = 0;
    while($i < count($arr1) && $j < count($arr2)) {
        if($arr1[$i] < $arr2[$j]) {
            yield $arr1[$i];
            $i++;
        }
        elseif($arr1[$i] > $arr2[$j]){
            $j++;
        }
        else{
            $i++;
            $j++;
        }
    }
    while($i < count($arr1)) {
        yield $arr1[$i];
        $i++;
    }
}

// 遍历 generator
foreach (diff($array1, $array2) as $value) {
    $result[] = $value;
}

print_r($result);
?>

위 코드에서는 생성기를 사용하여 배열 차이 집합을 계산하는 순회를 시뮬레이션하는 diff 함수를 정의합니다. 이 알고리즘은 하위 배열을 순차적으로 정렬한 다음 커서 비교를 사용하여 두 배열 간의 차이점을 찾아 메모리와 CPU 시간을 덜 사용합니다.

5. 요약

PHP 개발에서는 큰 배열을 다룰 때 특히 주의해야 합니다. 너무 많은 메모리를 차지하고 메모리 오버플로가 발생할 수 있기 때문입니다. 이 기사에서는 대규모 배열을 처리하는 데 사용할 수 있는 알고리즘 최적화, 조각별 처리 기술, 생성기 시뮬레이션 순회 알고리즘과 같은 기술을 소개했습니다. 선택하는 방법은 요구 사항과 환경에 따라 다릅니다. 필요에 따라 다양한 기술을 사용하여 코드를 최적화하여 대규모 배열을 처리할 때 코드 성능과 유지 관리성을 향상시킬 수 있습니다.

위 내용은 PHP는 차이점 세트와 대규모 배열 메모리 오버플로를 발견했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

php 循环算法

성명：

이전 기사：PHP에서 배열을 문자열로 변환하는 방법다음 기사：PHP에서 배열을 문자열로 변환하는 방법