ホームページ >よくある問題 >データ正規化の目的は何ですか?

データ正規化の目的は何ですか?

青灯夜游
青灯夜游オリジナル
2021-05-07 16:33:1827839ブラウズ

データ正規化の目的は、前処理されたデータを特定の範囲に制限し、それによって単一のサンプル データによって引き起こされる悪影響を排除することです。データ正規化後は、最適解を見つけるための勾配降下の速度が加速され、精度が向上する可能性があります (KNN など)。

データ正規化の目的は何ですか?

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

##機械学習の分野では、さまざまな評価指標(つまり、特徴ベクトル内の異なる特徴が異なる評価指標となります)ディメンションやディメンション単位が異なることがよくあります。この状況はデータ分析の結果に影響します。指標間のディメンションの影響を排除するには、データ#標準化が必要です 、データ指標間の比較可能性を解決します。元のデータがデータ標準化によって処理されると、各指標は同程度の大きさになるため、包括的な比較評価に適しています。 その中で最も代表的なのがデータの正規化処理です。#。 (研究を参照してください: データの標準化/正規化)

# #つまり、 正規化の目的は、前処理されたデータを特定の範囲 ([0,1] や [-1,1] など) に制限し、それによって 単一のサンプル データ## を排除することです。 #によって引き起こされる悪影響。

1) 統計学における正規化の具体的な役割は、統一されたサンプル統計分布を要約することです。 。 0 と 1 の間の正規化は統計的確率分布であり、-1 と 1 の間の正規化は統計的座標分布です。

#2) 特異サンプル データとは、他の入力と比較して特に大きいまたは小さいサンプル ベクトルを指します。たとえば、以下は 2 つの特徴 (特徴ベクトル -> 列ベクトル) を持つサンプル データ x1、x2、x3、x4、x5、x6 です。ここで、x6 サンプルの 2 つの特徴は他のサンプルとは異なります。サンプル 言語の違いは比較的大きいため、x6 は特異なサンプル データであると考えられます。



# #特異なサンプル データが存在すると、トレーニング時間が増加し、収束に失敗する可能性もあります。そのため、

特異なサンプル データがある場合は、トレーニング前に前処理されたデータを正規化する必要があります

; 逆に、単一のサンプル データがないため、正規化を実行する必要はありません。

#-- 正規化が実行されない場合、特徴ベクトル内のさまざまな特徴の値に大きな差があるため、目的関数は「平坦」になります。このように勾配降下を行うと、勾配の方向が最小値の方向から外れてしまい、遠回りが多くなり、学習時間が長くなってしまいます。

#

-- 正規化すると、目的関数がより「丸く」見えるようになり、トレーニングが大幅に高速化され、数値が減少します。階段が多く、寄り道が多い。 ###############################################総括する正規化には次の利点があることがわかります。すなわち、


1)速度正規化後のアップ 最適解を見つけるための勾配降下の速度;

##2 )正規化により精度が向上する可能性があります (KNN など)

##注: あらゆる問題およびあらゆるモデルに適用した場合に、アルゴリズムの精度を向上させ、アルゴリズムの収束速度を加速できるデータ標準化手法はありません。 さらに関連する知識については、FAQ 列をご覧ください。

以上がデータ正規化の目的は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。