>일반적인 문제 >연관 규칙 마이닝

연관 규칙 마이닝

(*-*)浩
(*-*)浩원래의
2019-07-27 14:42:196383검색

연관 규칙은 다음과 같은 형태로 암시됩니다. 그중 연관규칙 XY는 지지와 신뢰를 갖고 있다.

연관 규칙 마이닝

연관 규칙 마이닝 프로세스는 주로 두 단계로 구성됩니다. 첫 번째 단계는 먼저 데이터 수집에서 모든 고빈도 항목 세트(Frequent Itemsets)를 찾아야 하고, 두 번째 단계는 이러한 고빈도 항목에서 생성됩니다. 연관 규칙을 설정합니다. (추천 학습: PHP 비디오 튜토리얼)

연관 규칙 마이닝의 첫 번째 단계는 원본 데이터 컬렉션에서 빈도가 높은 항목 세트(Large Itemsets)를 모두 찾아야 합니다.

빈도가 높다는 것은 특정 항목 그룹의 빈도가 전체 기록에 비해 특정 수준에 도달해야 함을 의미합니다. 항목 그룹의 발생 빈도를 지지도라고 합니다. 두 개의 항목 A와 B를 포함하는 2개 항목 집합을 예로 들면, 수식 1을 통해 {A, B}를 포함하는 항목 그룹의 지지도를 얻을 수 있습니다. 지지도가 설정된 최소 지지도 임계값보다 크거나 같은 경우, {A, B}를 고빈도 품목군이라고 합니다.

최소 지지도를 만족하는 k-항목 집합을 고주파 k-항목 집합(Frequent k-itemset)이라고 하며, 일반적으로 Large k 또는 빈번한 k로 표현됩니다. 그런 다음 알고리즘은 더 이상 빈도가 높은 항목 그룹을 찾을 수 없을 때까지 Large k 항목 그룹에서 Large k+1을 생성합니다.

연관 규칙 마이닝의 두 번째 단계는 연관 규칙(Association Rules)을 생성하는 것입니다. 고빈도 항목 그룹에서 연관 규칙을 생성하는 것은 이전 단계의 고빈도 k-항목 그룹을 사용하여 최소 신뢰도(Minimum Confidence)의 조건부 임계값에서 규칙으로 얻은 신뢰도가 최소값을 충족하는 경우 규칙을 생성하는 것입니다. 신뢰도 이 규칙을 연관 규칙이라고 합니다.

예를 들어, 빈도가 높은 k-항목 그룹 {A, B}를 통해 생성된 규칙 AB의 신뢰도는 공식 (2)를 통해 얻을 수 있습니다. 신뢰도가 최소 신뢰도보다 크거나 같으면 AB를 호출합니다. 연관 규칙.

규칙에서 처리되는 변수의 범주에 따라

연관 규칙에서 처리되는 변수는 부울형과 숫자형으로 나눌 수 있습니다. 부울 연관 규칙에 의해 처리된 값은 이산적이고 범주형이며 이러한 변수 간의 관계를 표시하는 반면, 수치 연관 규칙은 다차원 연관 규칙 또는 다층 연관 규칙과 결합하여 수치 필드를 동적으로 분할할 수 있습니다. 또는 원본 데이터를 직접 처리할 수도 있습니다. 물론 수치 연관 규칙에는 범주 변수가 포함될 수도 있습니다. 예: 성별 = "여성" => 직업 = "비서", 이는 부울 연관 규칙입니다. 성별 = "여성" => 평균(소득) = 2300, 관련 소득은 숫자 유형이므로 숫자입니다. 연관 규칙.

규칙에 포함된 데이터의 추상화 수준에 따라

규칙에 포함된 데이터의 추상화 수준에 따라 단일 계층 연결 규칙과 다층 연결 규칙으로 나눌 수 있습니다. 단일 수준 연관 규칙에서는 모든 변수가 실제 데이터에 여러 다른 수준이 있다는 점을 고려하지 않습니다. 다단계 연관 규칙에서는 데이터의 다단계 특성이 완전히 고려됩니다. 예: IBM 데스크탑 =>Sony 프린터는 세부 데이터에 대한 단일 레이어 연관 규칙입니다. 데스크탑 =>Sony 프린터는 상위 레벨과 세부 레벨 간의 다중 레이어 연관 규칙입니다.

규칙에 포함된 데이터의 차원성에 따라

연관 규칙의 데이터는 1차원과 다차원으로 나눌 수 있습니다. 1차원 연관 규칙에서는 사용자가 구매한 항목과 같은 데이터의 한 차원만 포함하는 반면, 다차원 연관 규칙에서는 처리할 데이터에 여러 차원이 포함됩니다. 즉, 1차원 연관 규칙은 단일 속성의 일부 관계를 처리하고, 다차원 연관 규칙은 다양한 속성 간의 일부 관계를 처리합니다. 예: 맥주 => 기저귀, 이 규칙은 사용자가 구매한 품목에만 관련됩니다. 성별 = "여성" => 직업 = "비서", 이 규칙은 두 차원에 대한 정보를 포함합니다.

PHP 관련 기술 기사를 더 보려면 PHP 그래픽 튜토리얼 칼럼을 방문하여 알아보세요!

위 내용은 연관 규칙 마이닝의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.