프로그래밍에서 해시 테이블은 매우 유용한 데이터 구조입니다. O(1) 시간 안에 요소를 찾아서 삽입할 수 있지만, 해시 함수는 두 개의 서로 다른 키 값이 동일한 인덱스에 매핑될 때 발생하는 문제인 해시 충돌을 일으킬 수 있습니다. 이 기사에서는 해시 충돌 문제를 해결하는 여러 가지 방법과 이를 PHP에서 구현하는 방법을 살펴보겠습니다.
PHP에서는 배열을 사용하여 체인 주소 방법을 구현할 수 있습니다. 예를 들어 다음은 간단한 구현입니다.
class Hashtable { private $table = array(); public function put($key, $value) { $hash = $this->hashFunction($key); if (!isset($this->table[$hash])) { $this->table[$hash] = array(); } foreach ($this->table[$hash] as &$v) { if ($v['key'] == $key) { $v['value'] = $value; return; } } $this->table[$hash][] = array('key' => $key, 'value' => $value); } public function get($key) { $hash = $this->hashFunction($key); if (isset($this->table[$hash])) { foreach ($this->table[$hash] as $v) { if ($v['key'] == $key) { return $v['value']; } } } return null; } private function hashFunction($key) { return crc32($key); // 简单的哈希函数 } }
이 예에서는 해시 테이블 클래스 Hashtable을 정의합니다. crc32 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키-값 쌍을 2차원 배열에 저장합니다. 요소를 찾거나 삽입해야 하는 경우 먼저 해당 요소의 해시 값을 계산한 다음 해당 요소의 해시 값이 있는 위치가 이미 존재하는지 확인합니다. 존재하지 않으면 새 목록을 만들고 해당 요소를 목록에 추가합니다. 위치가 이미 존재하는 경우 목록을 반복하고 키에 해당하는 요소를 찾아 값을 바꿉니다. 이 구현은 매우 간단하지만 해시 테이블의 크기가 커지면 연결 리스트의 길이가 매우 길어져 검색 효율성에 영향을 줄 수 있습니다.
PHP에서는 배열을 사용하여 개방형 주소 지정을 구현할 수 있습니다. 예를 들어 간단한 구현은 다음과 같습니다.
class Hashtable { private $table = array(); public function put($key, $value) { $i = $this->hashFunction($key); $j = $i; do { if (!isset($this->table[$j])) { $this->table[$j] = array('key' => $key, 'value' => $value); return; } if ($this->table[$j]['key'] == $key) { $this->table[$j]['value'] = $value; return; } $j = ($j + 1) % count($this->table); } while ($j != $i); } public function get($key) { $i = $this->hashFunction($key); $j = $i; do { if (isset($this->table[$j])) { if ($this->table[$j]['key'] == $key) { return $this->table[$j]['value']; } } else { return null; } $j = ($j + 1) % count($this->table); } while ($j != $i); return null; } private function hashFunction($key) { return crc32($key); // 简单的哈希函数 } }
이 예에서는 crc32 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키-값 쌍을 1차원으로 저장하는 또 다른 해시 테이블 클래스 Hashtable을 정의합니다. 정렬. 요소를 찾거나 삽입해야 하는 경우 먼저 해당 요소의 해시 값을 계산하고 해당 위치에서 배열 탐색을 시작합니다. 위치가 비어 있으면 해당 위치에 새 요소를 삽입합니다. 위치가 이미 점유된 경우 빈 위치를 찾거나 전체 배열을 탐색할 때까지 배열을 계속 탐색합니다. 이 구현의 한 가지 단점은 해시 테이블의 크기가 커지면 저장소를 다시 할당하고 기존 요소를 새 배열에 복사해야 한다는 것입니다.
PHP에서는 배열을 사용하여 이중 해싱을 구현할 수 있습니다. 예를 들어 간단한 구현은 다음과 같습니다.
class Hashtable { private $table = array(); public function put($key, $value) { $i = $this->hashFunction1($key); $j = $this->hashFunction2($key); $k = $i; do { if (!isset($this->table[$k])) { $this->table[$k] = array('key' => $key, 'value' => $value); return; } if ($this->table[$k]['key'] == $key) { $this->table[$k]['value'] = $value; return; } $k = ($k + $j) % count($this->table); } while ($k != $i); } public function get($key) { $i = $this->hashFunction1($key); $j = $this->hashFunction2($key); $k = $i; do { if (isset($this->table[$k])) { if ($this->table[$k]['key'] == $key) { return $this->table[$k]['value']; } } else { return null; } $k = ($k + $j) % count($this->table); } while ($k != $i); return null; } private function hashFunction1($key) { return crc32($key); } private function hashFunction2($key) { return ((int)(crc32($key) / count($this->table)) + 1) % count($this->table); } }
이 예에서는 두 개의 해시 함수를 사용하여 각 키의 해시 값을 계산하고 키 값 쌍을 결합하는 또 다른 해시 테이블 클래스 Hashtable을 정의합니다. 1차원 배열에 저장됩니다. . 요소를 찾거나 삽입해야 하는 경우 먼저 해당 해시 값을 계산하고 첫 번째 해시 값을 초기 위치로 사용하고 두 번째 해시 값을 사용하여 각 검색의 단계 크기를 계산합니다. 위치가 비어 있으면 해당 위치에 새 요소를 삽입합니다. 위치가 이미 점유된 경우 빈 위치를 찾거나 전체 배열을 탐색할 때까지 배열을 계속 탐색합니다. 이 구현의 한 가지 장점은 두 개의 서로 다른 해시 함수를 사용하면 해시 충돌 횟수를 줄일 수 있다는 것입니다. 여기서 두 번째 해시 함수를 사용하면 "클러스터링" 상황의 발생을 줄일 수 있습니다.
결론
PHP에서 해시 테이블을 구현하는 것은 재미있고 유용한 연습입니다. 코드를 구현하는 동안 해시 충돌을 해결하기 위해 일반적으로 사용되는 세 가지 방법인 체인 주소 방법, 개방형 주소 지정 방법 및 이중 해시 방법을 확인했습니다. 각 방법에는 장점과 단점이 있으므로 현재 애플리케이션 시나리오에 가장 적합한 방법을 선택해야 합니다.
마지막으로 해시 테이블은 검색 및 삽입 작업에 매우 효율적이지만 해시 테이블의 로드 팩터가 너무 높으면 성능이 급격히 저하된다는 점에 유의해야 합니다. 따라서 해시 테이블의 효율적인 운영을 위해서는 요소 삽입 시 로드 팩터를 확인하고, 필요한 경우 메모리를 재할당해야 합니다.
위 내용은 PHP가 해시 충돌을 해결하는 방법에 대해 토론의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!