首頁 >常見問題 >資料歸一化處理的目的是什麼

資料歸一化處理的目的是什麼

青灯夜游原創: 2021-05-07 16:33:1827903瀏覽

資料歸一化處理的目的在於：使得預處理的資料被限定在一定的範圍內，從而消除奇異樣本資料所導致的不良影響。資料歸一化處理後，可加快梯度下降求最優解的速度，且有可能提高精度（如KNN）。

資料歸一化處理的目的是什麼

本教學操作環境：windows7系統、Dell G3電腦。

#在機器學習領域中，不同評估指標（即特徵向量中的不同特徵就是所述的不同評價指標）#往往有不同的量綱和量綱單位，這樣的情況會影響到資料分析的結果，為了消除指標之間的量綱影響，需要進行資料標準化處理，以解決資料指標之間的可比性。原始資料經過資料標準化處理後，各指標為同一數量級，適合進行綜合對照評估。 其中，最典型的就是資料的歸一化處理。（可參考學習：資料標準化/歸一化）

簡而言之，歸一化的目的就是使得預處理的資料被限定在一定的範圍內（例如[0,1]或[-1,1]），從而消除 #奇異樣本資料導致的不良影響。

1）在統計學中，歸一化的具體作用是歸納統一樣本的統計分佈性。歸一化在0~1之間是統計的機率分佈，歸一化在-1~ 1之間是統計的座標分佈。

2）奇異樣本資料是指相對於其他輸入樣本特別大或特別小的樣本向量（即特徵向量），譬如，下面為具有兩個特徵的樣本資料x1、x2、x3、x4、x5、x6（特徵向量—>列向量）,其中x6這個樣本的兩個特徵相對其他樣本而言相差比較大，因此，x6認為是奇異樣本資料。