>  기사  >  백엔드 개발  >  PHP에서 코사인 유사성 알고리즘을 구현하는 방법

PHP에서 코사인 유사성 알고리즘을 구현하는 방법

PHPz
PHPz원래의
2023-03-31 10:08:08783검색

데이터 분석, 정보 검색, 기계 학습 및 기타 분야에서 널리 사용될 수 있는 코사인 유사성 알고리즘의 개념과 원리를 이해합니다. 실제 응용 프로그램에서 일반적으로 사용되는 서버 측 프로그래밍 언어로서 PHP는 코사인 유사성 알고리즘을 어떻게 구현합니까? 이 기사에서는 PHP를 사용하여 코사인 유사성 알고리즘을 구현하는 방법을 소개합니다.

1. 코사인 유사성 알고리즘의 개념 및 원리

코사인 유사성 알고리즘은 두 벡터 간의 유사도를 계산하는 데 사용되는 일반적인 유사성 계산 방법입니다. 핵심 아이디어는 두 벡터 사이의 각도의 코사인을 유사성으로 사용하는 것입니다.

코사인 유사성 알고리즘의 수식은 다음과 같습니다.

cosθ= A·B / |A|·|B|

여기서 A와 B는 두 벡터이고, cosθ는 이들 사이의 코사인 값, |A | 및 |B|는 각각 모듈 길이입니다.

코사인 유사성 알고리즘에서 유사성 값 범위는 -1에서 1 사이입니다. 두 벡터가 동일한 방향을 갖는 경우 코사인 값은 1로, 두 벡터가 직교하는 경우 코사인 값은 0으로, 두 벡터가 완전히 반대인 경우를 나타냅니다. 방향에서 코사인 값이 -1이면 벡터가 완전히 반대라는 의미입니다.

2. PHP는 코사인 유사성 알고리즘을 구현합니다

PHP에서는 배열을 통해 벡터를 저장하고 내장 함수를 사용하여 계산을 수행할 수 있습니다. 다음은 PHP에서 코사인 유사성 알고리즘을 구현할 수 있는 샘플 코드입니다.

/**

  • 코사인 유사성 알고리즘 구현
  • @param array $a 벡터 A 값
  • @param array $b 벡터 B 값
  • @return float 코사인 유사성 값
    */
    function cosine_similarity($a, $b) {
    $dot_product = 0;
    $a_norm = 0;
    $b_norm = 0;

    foreach($a $key => $value) {

      $dot_product += $value * $b[$key];
      $a_norm += pow($value, 2);
      $b_norm += pow($b[$key], 2);

    }

    $a_norm = sqrt($a_norm);
    $b_norm = sqrt($b_norm);

    return $dot_product / ($a_norm * $b_norm);
    }

    // 예
    $a = [1, 2, 3, 4, 5];
    $b = [6, 7, 8, 9, 10];
    $c = [2, 3, 6 , 7, 9];

    echo cosine_similarity($a, $b) . "n";
    echo cosine_similarity($a, $c) . "n";
    ?>

    위 코드에서 cosine_similarity 함수 두 개의 벡터 A와 B를 받은 다음 키-값 쌍을 반복하고 내적과 정규화된 값을 계산합니다. 궁극적으로 이 함수는 코사인 유사성 값을 반환하며, 이는 벡터 간의 유사성을 평가하는 지표로 사용할 수 있습니다.

    3. 요약

    코사인 유사성 알고리즘은 두 벡터의 유사성을 계산하는 일반적인 방법 중 하나이며 데이터 분석, 정보 검색, 기계 학습 및 기타 분야에서 널리 사용될 수 있습니다. 실제 응용에서는 PHP에 내장된 함수를 사용하여 코사인 유사성 알고리즘을 구현하고 벡터 간의 유사성을 빠르게 계산할 수 있습니다. 이 기사에서 소개된 방법과 샘플 코드가 독자들에게 도움이 되기를 바랍니다.

    위 내용은 PHP에서 코사인 유사성 알고리즘을 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.