데이터 프레임의 열 정규화
다양한 값 범위의 열이 포함된 데이터 프레임으로 작업할 때 정규화를 통해 데이터 값을 일관된 규모로 정렬할 수 있습니다. , 비교 및 분석을 촉진합니다. 이 경우 목표는 데이터프레임의 열을 정규화하여 각 값을 0과 1 사이에 있도록 변환하는 것입니다.
이를 달성하기 위한 편리한 접근 방식은 Pandas 라이브러리를 사용하는 것입니다. Pandas는 열별 작업을 활용하여 효율적인 정규화를 허용합니다:
평균 정규화:
<code class="python">import pandas as pd # Create a dataframe with varying column ranges df = pd.DataFrame({ 'A': [1000, 765, 800], 'B': [10, 5, 7], 'C': [0.5, 0.35, 0.09] }) # Normalize using mean normalization normalized_df = (df - df.mean()) / df.std() # Display normalized dataframe print(normalized_df)</code>
출력:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
최소-최대 정규화:
<code class="python"># Normalize using min-max normalization normalized_df = (df - df.min()) / (df.max() - df.min()) # Display normalized dataframe print(normalized_df)</code>
출력:
A B C 0 1.000 1.0 1.000000 1 0.765 0.5 0.700000 2 0.800 0.7 0.180000
평균 및 최소-최대 정규화 기법 모두 다음을 보장합니다. 각 열의 값이 [0, 1] 범위 내에 속하므로 데이터 비교 및 분석이 용이합니다. Pandas의 열별 작업을 활용하면 이러한 정규화를 효율적으로 수행할 수 있습니다.
위 내용은 Python에서 데이터프레임의 열을 정규화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!