>백엔드 개발 >파이썬 튜토리얼 >Python에서 SVM 알고리즘을 작성하는 방법은 무엇입니까?

Python에서 SVM 알고리즘을 작성하는 방법은 무엇입니까?

WBOY
WBOY원래의
2023-09-21 12:06:11786검색

Python에서 SVM 알고리즘을 작성하는 방법은 무엇입니까?

SVM 알고리즘을 Python으로 작성하는 방법은 무엇입니까?

SVM(Support Vector Machine)은 통계 학습 이론과 구조적 위험 최소화 원리를 기반으로 일반적으로 사용되는 분류 및 회귀 알고리즘입니다. 높은 정확도와 일반화 능력을 갖추고 있어 다양한 데이터 유형에 적합합니다. 이번 글에서는 Python을 사용하여 SVM 알고리즘을 작성하는 방법을 자세히 소개하고 구체적인 코드 예제를 제공하겠습니다.

  1. Python 및 관련 라이브러리 설치
    SVM 알고리즘 작성을 시작하기 전에 먼저 Python 및 관련 기계 학습 라이브러리가 설치되어 있는지 확인해야 합니다. Python의 통합 개발 환경으로 Anaconda를 사용하는 것이 좋습니다. Python 인터프리터가 함께 제공될 뿐만 아니라 일반적으로 사용되는 많은 과학 컴퓨팅 및 기계 학습 라이브러리도 포함되어 있습니다. 다음 명령을 사용하여 scikit-learn 라이브러리를 설치합니다.
pip install scikit-learn
  1. 필요한 라이브러리 가져오기
    scikit-learn, numpy 및 matplotlib를 포함하여 필요한 라이브러리를 가져옵니다.
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets
  1. 데이터세트 로드
    SVM 알고리즘 작성을 시연하기 위해 유명한 Iris 데이터세트를 사용하겠습니다. Iris 데이터 세트에는 150개의 붓꽃 샘플이 포함되어 있으며 각 샘플에는 4개의 특징이 있습니다. 우리는 데이터 세트를 붓꽃의 두 가지 품종인 Setosa와 Versicolor라는 두 가지 범주로 나누었습니다.
iris = datasets.load_iris()
X = iris.data[:, :2]  # 我们只使用前两个特征
y = iris.target
  1. 모델 교육
    SVM을 사용하여 모델을 교육합니다. 여기서는 선형 커널 함수를 사용합니다.
C = 1.0  # SVM正则化参数
svc = svm.SVC(kernel='linear', C=C).fit(X, y)
  1. 결정 경계 그리기
    SVM의 분류 효과를 더 잘 이해하기 위해 결정 경계를 그릴 수 있습니다. 먼저 전체 기능 공간을 샘플링하기 위해 그리드를 만듭니다.
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = (x_max / x_min)/100
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

그런 다음 이 그리드를 입력 특성으로 사용하여 결정 경계를 예측하고 얻습니다.

Z = svc.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

마지막으로 matplotlib 라이브러리를 사용하여 샘플 포인트와 결정 경계를 그립니다.

plt.contourf(xx, yy, Z, cmap=plt.cm.Paired, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())
plt.show()
  1. 전체 코드 예시
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm, datasets

# 加载数据集
iris = datasets.load_iris()
X = iris.data[:, :2]
y = iris.target

# 训练模型
C = 1.0  # SVM正则化参数
svc = svm.SVC(kernel='linear', C=C).fit(X, y)

# 画出决策边界
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
h = (x_max / x_min)/100
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
Z = svc.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contourf(xx, yy, Z, cmap=plt.cm.Paired, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())
plt.show()

요약:
위 단계를 통해 Python을 사용하여 SVM 알고리즘을 성공적으로 작성하고 Iris 데이터 세트를 통해 시연했습니다. 물론 이는 SVM 알고리즘의 단순한 적용일 뿐이며, 다양한 커널 기능 사용, 정규화 매개변수 C 조정 등 SVM을 확장하고 개선하는 방법은 많습니다. 이 글이 SVM 알고리즘을 배우고 이해하는 데 도움이 되기를 바랍니다.

위 내용은 Python에서 SVM 알고리즘을 작성하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.