>백엔드 개발 >파이썬 튜토리얼 >맞춤 대 Fit_transform

맞춤 대 Fit_transform

DDD
DDD원래의
2025-01-07 20:14:43664검색

Fit vs Fit_transform

fit()fit_transform()의 차이점이 궁금하신가요? 이 두 기능은 데이터 전처리 중에 자주 나타납니다. 차이점을 자세히 살펴보고 예를 들어 설명해 보겠습니다.

데이터 표준화는 일반적으로 평균, 최소값, 최대값, 분산 등 데이터의 다양한 매개변수를 계산해야 하는 중요한 전처리 단계입니다. fit_transform()은 이러한 매개변수를 계산하여 데이터 세트에 적용하는 반면, fit()은 이러한 매개변수만 계산하고 데이터 세트에 적용하지 않습니다.

작은 데이터 배열이 있다고 가정해 보겠습니다.

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

각각 fit()transform() 사용:

<code class="language-python">from sklearn.preprocessing import StandardScaler

# 步骤 1
scaler = StandardScaler()

# 步骤 2
scaler.fit(data)  # 此处仅计算均值和标准差,不进行数据缩放

# 步骤 3
scaled_data = scaler.transform(data)  # 现在 scaled_data 包含标准化后的数据</code>

사용 fit_transform():

<code class="language-python">from sklearn.preprocessing import StandardScaler

# 步骤 1
scaler = StandardScaler()

# 步骤 2
scaled_data = scaler.fit_transform(data)  # scaled_data 包含标准化后的数据</code>

fit_transform()을 사용하면 추가 단계가 제거되는 것을 볼 수 있습니다.

어떤 기능을 선택할지는 특정 애플리케이션 시나리오에 따라 다릅니다. 먼저 매개변수를 계산한 다음 여러 데이터 세트(예: 훈련 및 테스트 세트)에 변환을 적용해야 하는 경우 각각 fit()transform()을 사용하는 것이 더 적합합니다. 하지만 단일 데이터 세트에만 변환을 적용해야 하는 경우 fit_transform()를 사용하면 전처리 프로세스를 더 깔끔하게 만들 수 있습니다.

위 내용은 맞춤 대 Fit_transform의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.