正規化された列: 値を範囲内に維持する
データ分析に関しては、値が範囲内に存在することがよくあるため、解釈が少し難しくなります難しい。正規化は、値を 0 と 1 の間の一貫したスケールに変換することで役に立ちます。
データフレームの例を考えてみましょう:
df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09
解決策 1: 平均正規化
Pandas を使用すると、平均からの偏差を計算し、それを標準偏差で標準化することで列を正規化できます。
normalized_df = (df - df.mean()) / df.std()
これにより、次のようになります。
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
解決策 2: 最小-最大正規化
代わりに、データの最小値と最大値に基づいて値をスケーリングする最小-最大正規化を実行できます。
normalized_df = (df - df.min()) / (df.max() - df.min())
結果in:
normalized_df: A B C 1.000000 1.000000 1.000000 0.765592 0.500000 0.700000 0.800457 0.700000 0.180000
Pandas は列ごとに正規化を自動的に適用するため、プロセスが効率的かつ簡単になることに注意してください。
以上が正規化を使用してデータ値を範囲内に保つにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。