>  기사  >  백엔드 개발  >  PHP에서 K 최근접 이웃 알고리즘을 구현하는 방법

PHP에서 K 최근접 이웃 알고리즘을 구현하는 방법

WBOY
WBOY원래의
2023-07-07 10:58:391074검색

K 최근접 이웃 알고리즘을 PHP에서 구현하는 방법

K 최근접 이웃 알고리즘은 간단하고 일반적으로 사용되는 기계 학습 알고리즘으로 분류 및 회귀 문제에 널리 사용됩니다. 기본 원리는 분류할 샘플과 알려진 샘플 사이의 거리를 계산하여 가장 가까운 K개의 알려진 샘플이 속하는 범주로 분류할 샘플을 분류하는 것입니다. 이 글에서는 K-최근접 이웃 알고리즘을 PHP에서 구현하는 방법을 소개하고 코드 예제를 제공합니다.

  1. 데이터 준비
    먼저 알려진 샘플 데이터와 분류할 샘플 데이터를 준비해야 합니다. 샘플 데이터에는 카테고리와 특성 값이 포함되어 있고, 분류할 샘플 데이터에는 특성 값만 포함되어 있는 것으로 알려져 있습니다. 예제를 단순화하기 위해 알려진 샘플 데이터와 분류할 샘플 데이터가 모두 배열 형태로 표현된다고 가정합니다. 다음은 샘플 데이터입니다:

알려진 샘플 데이터:
$knownSamples = array(

array('class' => 'A', 'features' => array(2, 3)),
array('class' => 'A', 'features' => array(4, 5)),
array('class' => 'B', 'features' => array(1, 1)),
array('class' => 'B', 'features' => array(3, 2)),

);

분류할 샘플 데이터:
$unknownSample = array('features' => array(2, 2) ) );

  1. 거리 계산
    다음으로, 분류할 샘플과 알려진 샘플 사이의 거리를 계산하는 함수를 작성해야 합니다. 일반적으로 사용되는 거리 측정 방법에는 유클리드 거리, 맨해튼 거리 등이 있습니다. 다음은 유클리드 거리를 계산하는 예입니다.

function euclideanDistance($sample1, $sample2) {

$sum = 0;
for ($i = 0; $i < count($sample1); $i++) {
    $sum += pow($sample1[$i] - $sample2[$i], 2);
}
return sqrt($sum);

}

  1. K개의 최근접 이웃 찾기
    이 단계에서는 거리를 구하는 함수를 작성해야 합니다. K개의 알려진 샘플을 분류할 수 있습니다. 다음은 함수 예시입니다.

function findNeighbors($knownSamples, $unknownSample, $k) {

$distances = array();
foreach ($knownSamples as $knownSample) {
    $distance = euclideanDistance($knownSample['features'], $unknownSample['features']);
    $distances[] = array('class' => $knownSample['class'], 'distance' => $distance);
}
usort($distances, function ($a, $b) {
    return $a['distance'] - $b['distance'];
});
return array_slice($distances, 0, $k);

}

  1. Classification
    마지막으로 K개의 가장 가까운 이웃의 범주를 기반으로 분류하는 함수를 작성해야 합니다. . 다음은 샘플 함수입니다.

function classify($neighbors) {

$classes = array();
foreach ($neighbors as $neighbor) {
    $classes[] = $neighbor['class'];
}
$classCounts = array_count_values($classes);
arsort($classCounts);
return key($classCounts);

}

  1. 전체 예제
    다음은 전체 샘플 코드입니다.
function euclideanDistance($sample1, $sample2) {
    $sum = 0;
    for ($i = 0; $i < count($sample1); $i++) {
        $sum += pow($sample1[$i] - $sample2[$i], 2);
    }
    return sqrt($sum);
}

function findNeighbors($knownSamples, $unknownSample, $k) {
    $distances = array();
    foreach ($knownSamples as $knownSample) {
        $distance = euclideanDistance($knownSample['features'], $unknownSample['features']);
        $distances[] = array('class' => $knownSample['class'], 'distance' => $distance);
    }
    usort($distances, function ($a, $b) {
        return $a['distance'] - $b['distance'];
    });
    return array_slice($distances, 0, $k);
}

function classify($neighbors) {
    $classes = array();
    foreach ($neighbors as $neighbor) {
        $classes[] = $neighbor['class'];
    }
    $classCounts = array_count_values($classes);
    arsort($classCounts);
    return key($classCounts);
}

$knownSamples = array(
    array('class' => 'A', 'features' => array(2, 3)),
    array('class' => 'A', 'features' => array(4, 5)),
    array('class' => 'B', 'features' => array(1, 1)),
    array('class' => 'B', 'features' => array(3, 2)),
);

$unknownSample = array('features' => array(2, 2));

$neighbors = findNeighbors($knownSamples, $unknownSample, 3);
$class = classify($neighbors);

echo "待分类样本的类别为:" . $class;

위 코드는 샘플의 카테고리를 다음으로 출력합니다. 분류되다.

요약:
이 글에서는 K 최근접 이웃 알고리즘을 PHP에서 구현하는 방법을 소개합니다. 분류하려는 샘플과 알려진 샘플 간의 거리를 계산하여 K개의 최근접 이웃을 찾은 후 이러한 최근접 이웃의 범주에 따라 분류합니다. K 최근접 이웃 알고리즘은 많은 분류 및 회귀 문제에 적합한 간단하고 일반적으로 사용되는 알고리즘입니다. PHP를 사용하여 K-최근접 이웃 알고리즘을 구현하는 것은 비교적 간단하며 완료하려면 몇 가지 함수만 작성하면 됩니다. 이 글이 독자들이 K-최근접 이웃 알고리즘을 이해하고 적용하는 데 도움이 되기를 바랍니다.

위 내용은 PHP에서 K 최근접 이웃 알고리즘을 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.