ホームページ  >  記事  >  バックエンド開発  >  正規化を使用してデータ値を範囲内に保つにはどうすればよいですか?

正規化を使用してデータ値を範囲内に保つにはどうすればよいですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-18 17:02:03839ブラウズ

How to Keep Data Values Within Range Using Normalization?

正規化された列: 値を範囲内に維持する

データ分析に関しては、値が範囲内に存在することがよくあるため、解釈が少し難しくなります難しい。正規化は、値を 0 と 1 の間の一貫したスケールに変換することで役に立ちます。

データフレームの例を考えてみましょう:

df:
    A   B   C
1000 10 0.5
765   5 0.35
800   7 0.09

解決策 1: 平均正規化

Pandas を使用すると、平均からの偏差を計算し、それを標準偏差で標準化することで列を正規化できます。

normalized_df = (df - df.mean()) / df.std()

これにより、次のようになります。

normalized_df:
    A   B   C
1.000000 1.000000 1.000000
0.765592 0.500000 0.700000
0.800457 0.700000 0.180000

解決策 2: 最小-最大正規化

代わりに、データの最小値と最大値に基づいて値をスケーリングする最小-最大正規化を実行できます。

normalized_df = (df - df.min()) / (df.max() - df.min())

結果in:

normalized_df:
    A   B   C
1.000000 1.000000 1.000000
0.765592 0.500000 0.700000
0.800457 0.700000 0.180000

Pandas は列ごとに正規化を自動的に適用するため、プロセスが効率的かつ簡単になることに注意してください。

以上が正規化を使用してデータ値を範囲内に保つにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。