>  기사  >  백엔드 개발  >  PHP가 해시 충돌을 해결하는 방법에 대해 토론

PHP가 해시 충돌을 해결하는 방법에 대해 토론

PHPz
PHPz원래의
2023-04-11 10:31:34937검색

프로그래밍에서 해시 테이블은 매우 유용한 데이터 구조입니다. O(1) 시간 안에 요소를 찾아서 삽입할 수 있지만, 해시 함수는 두 개의 서로 다른 키 값이 동일한 인덱스에 매핑될 때 발생하는 문제인 해시 충돌을 일으킬 수 있습니다. 이 기사에서는 해시 충돌 문제를 해결하는 여러 가지 방법과 이를 PHP에서 구현하는 방법을 살펴보겠습니다.

  1. 체인 주소 방법
    체인 주소 방법은 해시 충돌을 해결하는 가장 간단하고 일반적인 방법 중 하나입니다. 체인 주소 방법에서 각 해시 테이블 슬롯은 각 노드가 키-값 쌍을 포함하는 연결 목록을 가리킵니다. 해시 충돌이 발생하면 해당 위치의 연결 리스트에 새 요소가 추가됩니다. 요소를 찾을 때, 연결 리스트를 탐색하여 노드를 찾으면 됩니다.

PHP에서는 배열을 사용하여 체인 주소 방법을 구현할 수 있습니다. 예를 들어 다음은 간단한 구현입니다.

class Hashtable {
    private $table = array();
  
    public function put($key, $value) {
        $hash = $this->hashFunction($key);
        if (!isset($this->table[$hash])) {
            $this->table[$hash] = array();
        }
        foreach ($this->table[$hash] as &$v) {
            if ($v['key'] == $key) {
                $v['value'] = $value;
                return;
            }
        }
        $this->table[$hash][] = array('key' => $key, 'value' => $value);
    }
  
    public function get($key) {
        $hash = $this->hashFunction($key);
        if (isset($this->table[$hash])) {
            foreach ($this->table[$hash] as $v) {
                if ($v['key'] == $key) {
                    return $v['value'];
                }
            }
        }
        return null;
    }
  
    private function hashFunction($key) {
        return crc32($key); // 简单的哈希函数
    }
}

이 예에서는 해시 테이블 클래스 Hashtable을 정의합니다. crc32 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키-값 쌍을 2차원 배열에 저장합니다. 요소를 찾거나 삽입해야 하는 경우 먼저 해당 요소의 해시 값을 계산한 다음 해당 요소의 해시 값이 있는 위치가 이미 존재하는지 확인합니다. 존재하지 않으면 새 목록을 만들고 해당 요소를 목록에 추가합니다. 위치가 이미 존재하는 경우 목록을 반복하고 키에 해당하는 요소를 찾아 값을 바꿉니다. 이 구현은 매우 간단하지만 해시 테이블의 크기가 커지면 연결 리스트의 길이가 매우 길어져 검색 효율성에 영향을 줄 수 있습니다.

  1. 개방형 주소 지정
    개방형 주소 지정은 해시 충돌을 해결하는 또 다른 방법입니다. 개방형 주소 지정에서는 해시 충돌이 발생하면 연결 목록에 새 요소를 추가하는 대신 원래 위치에서 시작하여 빈 슬롯을 계속 찾아 요소를 첫 번째 사용 가능한 위치에 삽입합니다. 이 방법의 장점은 연결리스트가 필요하지 않으며 메모리 사용량을 줄일 수 있다는 것입니다.

PHP에서는 배열을 사용하여 개방형 주소 지정을 구현할 수 있습니다. 예를 들어 간단한 구현은 다음과 같습니다.

class Hashtable {
    private $table = array();
  
    public function put($key, $value) {
        $i = $this->hashFunction($key);
        $j = $i;
        do {
            if (!isset($this->table[$j])) {
                $this->table[$j] = array('key' => $key, 'value' => $value);
                return;
            }
            if ($this->table[$j]['key'] == $key) {
                $this->table[$j]['value'] = $value;
                return;
            }
            $j = ($j + 1) % count($this->table);
        } while ($j != $i);
    }
  
    public function get($key) {
        $i = $this->hashFunction($key);
        $j = $i;
        do {
            if (isset($this->table[$j])) {
                if ($this->table[$j]['key'] == $key) {
                    return $this->table[$j]['value'];
                }
            } else {
                return null;
            }
            $j = ($j + 1) % count($this->table);
        } while ($j != $i);
        return null;
    }
  
    private function hashFunction($key) {
        return crc32($key); // 简单的哈希函数
    }
}

이 예에서는 crc32 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키-값 쌍을 1차원으로 저장하는 또 다른 해시 테이블 클래스 Hashtable을 정의합니다. 정렬. 요소를 찾거나 삽입해야 하는 경우 먼저 해당 요소의 해시 값을 계산하고 해당 위치에서 배열 탐색을 시작합니다. 위치가 비어 있으면 해당 위치에 새 요소를 삽입합니다. 위치가 이미 점유된 경우 빈 위치를 찾거나 전체 배열을 탐색할 때까지 배열을 계속 탐색합니다. 이 구현의 한 가지 단점은 해시 테이블의 크기가 커지면 저장소를 다시 할당하고 기존 요소를 새 배열에 복사해야 한다는 것입니다.

  1. 이중 해싱
    이중 해싱은 해시 충돌이 발생할 경우 새로운 위치를 찾기 위해 해시 함수를 사용하여 일련의 해시 값을 생성하는 방법입니다. 이중 해싱에서는 두 가지 서로 다른 해시 함수를 사용하여 각 키의 해시 값을 계산하고 해시 값의 순서를 따라 빈 위치를 찾습니다. 여러 해시 함수를 사용하면 해시 충돌 횟수가 줄어들고 조회 효율성이 향상됩니다.

PHP에서는 배열을 사용하여 이중 해싱을 구현할 수 있습니다. 예를 들어 간단한 구현은 다음과 같습니다.

class Hashtable {
    private $table = array();
  
    public function put($key, $value) {
        $i = $this->hashFunction1($key);
        $j = $this->hashFunction2($key);
        $k = $i;
        do {
            if (!isset($this->table[$k])) {
                $this->table[$k] = array('key' => $key, 'value' => $value);
                return;
            }
            if ($this->table[$k]['key'] == $key) {
                $this->table[$k]['value'] = $value;
                return;
            }
            $k = ($k + $j) % count($this->table);
        } while ($k != $i);
    }
  
    public function get($key) {
        $i = $this->hashFunction1($key);
        $j = $this->hashFunction2($key);
        $k = $i;
        do {
            if (isset($this->table[$k])) {
                if ($this->table[$k]['key'] == $key) {
                    return $this->table[$k]['value'];
                }
            } else {
                return null;
            }
            $k = ($k + $j) % count($this->table);
        } while ($k != $i);
        return null;
    }
  
    private function hashFunction1($key) {
        return crc32($key);
    }
  
    private function hashFunction2($key) {
        return ((int)(crc32($key) / count($this->table)) + 1) % count($this->table);
    }
}

이 예에서는 두 개의 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키 값 쌍을 결합하는 또 다른 해시 테이블 클래스 Hashtable을 정의합니다. 1차원 배열에 저장됩니다. . 요소를 찾거나 삽입해야 하는 경우 먼저 해당 해시 값을 계산하고 첫 번째 해시 값을 초기 위치로 사용하고 두 번째 해시 값을 사용하여 각 검색의 단계 크기를 계산합니다. 위치가 비어 있으면 해당 위치에 새 요소를 삽입합니다. 위치가 이미 점유된 경우 빈 위치를 찾거나 전체 배열을 탐색할 때까지 배열을 계속 탐색합니다. 이 구현의 한 가지 장점은 두 개의 서로 다른 해시 함수를 사용하면 해시 충돌 횟수를 줄일 수 있다는 것입니다. 여기서 두 번째 해시 함수를 사용하면 "클러스터링" 상황의 발생을 줄일 수 있습니다.

결론
PHP에서 해시 테이블을 구현하는 것은 재미있고 유용한 연습입니다. 코드를 구현하는 동안 해시 충돌을 해결하기 위해 일반적으로 사용되는 세 가지 방법인 체인 주소 방법, 개방형 주소 지정 방법 및 이중 해시 방법을 확인했습니다. 각 방법에는 장점과 단점이 있으므로 현재 애플리케이션 시나리오에 가장 적합한 방법을 선택해야 합니다.

마지막으로 해시 테이블은 검색 및 삽입 작업에 매우 효율적이지만 해시 테이블의 로드 팩터가 너무 높으면 성능이 급격히 저하된다는 점에 유의해야 합니다. 따라서 해시 테이블의 효율적인 운영을 위해서는 요소 삽입 시 로드 팩터를 확인하고, 필요한 경우 메모리를 재할당해야 합니다.

위 내용은 PHP가 해시 충돌을 해결하는 방법에 대해 토론의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.