>백엔드 개발 >PHP 문제 >PHP에서 고유한 문자열을 찾는 방법

PHP에서 고유한 문자열을 찾는 방법

PHPz
PHPz원래의
2023-03-29 10:11:30620검색

PHP는 동적 웹사이트 및 웹 애플리케이션 개발에 널리 사용되는 매우 인기 있는 웹 프로그래밍 언어입니다. 개발 과정에서 고유한 문자열을 찾는 등 문자열을 처리해야 하는 경우가 종종 있습니다. 이 기사에서는 PHP를 사용하여 고유한 문자열을 찾는 강력한 프로그램을 작성하는 방법을 소개합니다.

1. 고유 문자열이란 무엇입니까? 컴퓨터 과학에서 고유 문자열은 문자열에서 반복되는 문자가 없는 부분 문자열을 의미합니다. 예를 들어, "hello world" 문자열에서 반복되지 않는 하위 문자열은 "hel", "helo", "hell", "hello", "wor", "world" 등입니다.

2. 고유한 문자열을 찾는 알고리즘

고유한 문자열을 찾으려면 문자열을 처리하는 알고리즘을 사용해야 합니다. 일반적으로 사용되는 알고리즘에는 "슬라이딩 윈도우"와 "해시 테이블"이 있습니다.

슬라이딩 윈도우 알고리즘
  1. 슬라이딩 윈도우 알고리즘은 O(n) 시간 복잡도로 고유한 문자열을 찾을 수 있는 매우 효과적인 문자열 처리 알고리즘입니다.

이 알고리즘의 단계는 다음과 같습니다.

1) 각각 문자열의 첫 번째 문자를 가리키는 왼쪽과 오른쪽 두 개의 포인터를 정의합니다.

2) 해시 테이블을 사용하여 각 문자의 발생 횟수를 기록합니다.

3) 반복되는 문자가 나올 때까지 오른쪽 포인터를 오른쪽으로 이동하세요.

4) 더 이상 반복되는 문자가 없을 때까지 왼쪽 포인터를 오른쪽으로 이동합니다.

5) 오른쪽 포인터가 문자열 끝에 도달할 때까지 3단계와 4단계를 반복합니다.

6) 반복되지 않는 각 하위 문자열의 길이를 계산하고 가장 긴 반복되지 않는 하위 문자열을 찾습니다.

다음은 알고리즘의 PHP 구현입니다.

function findLongestSubstring($str){

$n = strlen($str);
$set = array();
$ans = $i = $j = 0;
while ($i < $n && $j < $n) {
    if (!isset($set[$str[$j]])) {
        $set[$str[$j++]] = true;
        $ans = max($ans, $j - $i);
    } else {
        unset($set[$str[$i++]]);
    }
}
return $ans;

}

해시 테이블 알고리즘
  1. 해시 테이블 알고리즘은 빠른 조회에 사용되는 데이터 구조입니다. 해시 테이블에 요소가 존재합니다. 이 알고리즘의 구현 아이디어는 다음과 같습니다.

1) 해시 테이블을 사용하여 문자가 나타나는 위치를 저장합니다.

2) 문자열을 탐색하여 해당 문자가 해시 테이블에 없으면 해시 테이블에 추가하고, 그렇지 않으면 문자의 위치 정보를 업데이트합니다.

3) 반복되지 않는 하위 문자열의 시작 위치와 끝 위치를 기록합니다.

4) 가장 긴 부분 문자열의 길이를 업데이트합니다.

5) 가장 긴 부분 문자열의 길이를 반환합니다.

다음은 이 알고리즘의 PHP 구현입니다.

function findLongestSubstring($str){

$n = strlen($str);
$map = array();
for ($i = $j = $ans = 0; $j < $n; $j++) {
    if (isset($map[$str[$j]])) {
        $i = max($map[$str[$j]], $i);
    }
    $ans = max($ans, $j - $i + 1);
    $map[$str[$j]] = $j + 1;
}
return $ans;

}

3. 테스트 프로그램

위 알고리즘의 정확성을 확인하기 위해 테스트 프로그램을 작성했습니다. 이 프로그램은 무작위로 문자열을 생성하고 위의 두 가지 알고리즘을 사용하여 가장 길고 반복되지 않는 부분 문자열을 찾을 수 있습니다. 알고리즘의 정확성과 실행 시간을 확인하기 위해 루프에서 프로그램을 실행할 수 있습니다.

다음은 테스트 프로그램의 PHP 코드입니다.

function randomString($length = 10) {

$str = '';
$chars = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
for ($i = 0; $i < $length; $i++) {
    $str .= $chars[rand(0, strlen($chars) - 1)];
}
return $str;

}

$N = 5;

for ($i = 0; $i < $N; $i++) {

$str = randomString(100000);
$start = microtime();
$ans1 = findLongestSubstring($str);
$end = microtime();
$time1 = ($end - $start) * 1000;

$start = microtime();
$ans2 = findLongestSubstring($str);
$end = microtime();
$time2 = ($end - $start) * 1000;

printf("Test case %d: %s\n", $i + 1, $str);
printf("滑动窗口算法: %d (%.3fms)\n", $ans1, $time1);
printf("哈希表算法: %d (%.3fms)\n", $ans2, $time2);

}

IV. 요약

이 기사에서는 PHP를 사용하여 고유한 부분 문자열을 찾는 프로그램을 작성하는 방법을 소개하고 일반적으로 사용되는 두 가지 알고리즘인 슬라이딩 윈도우 알고리즘과 해시 테이블 알고리즘을 소개합니다. 슬라이딩 윈도우 알고리즘은 시간 복잡도가 O(n)인 효율적인 알고리즘으로 대규모 데이터를 처리하는 데 적합합니다. 해시 테이블 알고리즘은 공간 활용 측면에서 제어가 용이하지만 시간 복잡도가 높습니다. 프로그램의 테스트 절차는 현재 시나리오에 가장 적합한 알고리즘을 선택하기 위해 알고리즘의 실행 시간과 정확성을 확인하는 데 도움이 될 수 있습니다.

위 내용은 PHP에서 고유한 문자열을 찾는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.