>  기사  >  데이터 베이스  >  ## SQL 데이터베이스의 이진 문자열에서 해밍 거리를 효율적으로 계산하려면 어떻게 해야 합니까?

## SQL 데이터베이스의 이진 문자열에서 해밍 거리를 효율적으로 계산하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-10-24 19:00:02327검색

## How Can We Efficiently Calculate Hamming Distance on Binary Strings in SQL Databases?

SQL의 바이너리 문자열에 대한 해밍 거리 계산

SQL 데이터베이스에 저장된 바이너리 문자열 간의 해밍 거리를 효율적으로 계산하려면 BINARY를 사용합니다. 열은 성능 저하로 인해 권장되지 않습니다. 대신 데이터를 여러 BIGINT 열로 분할하여 원본 데이터의 하위 문자열을 나타내는 것을 고려해 보세요.

이 접근 방식에 따라 아래 제공된 것과 같은 사용자 정의 함수를 생성할 수 있습니다.

<code class="sql">CREATE FUNCTION HAMMINGDISTANCE(
  A0 BIGINT, A1 BIGINT, A2 BIGINT, A3 BIGINT, 
  B0 BIGINT, B1 BIGINT, B2 BIGINT, B3 BIGINT
)
RETURNS INT DETERMINISTIC
RETURN 
  BIT_COUNT(A0 ^ B0) +
  BIT_COUNT(A1 ^ B1) +
  BIT_COUNT(A2 ^ B2) +
  BIT_COUNT(A3 ^ B3);</code>

이것은 함수는 원래 32바이트 BINARY 열의 하위 문자열을 나타내는 4개의 BIGINT 열에서 작동합니다. 각 부분 문자열의 해밍 거리를 계산하고 결과를 합산합니다.

이 방법을 사용하면 테스트에서 알 수 있듯이 속도가 크게 향상되며 BINARY 열 기반 접근 방식보다 100배 이상 빠릅니다.

또한 BINARY 열에서 해밍 거리를 계산하기 위해 하위 문자열 변환을 사용하는 대체 접근 방식이 제시되지만 성능 고려 사항으로 인해 BIGINT 접근 방식보다 열등한 것으로 간주됩니다.

위 내용은 ## SQL 데이터베이스의 이진 문자열에서 해밍 거리를 효율적으로 계산하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.