資料預處理的方法有:1、資料清理,透過填入缺失的值、光滑雜訊資料、識別或刪除離群點並解決不一致性來「清理」資料;2、資料集成,將多個資料來源中的資料結合起來並統一存儲,建立資料倉儲的過程其實就是資料整合;3、資料變換;4、資料歸約。
本教學操作環境:windows7系統、Dell G3電腦。
資料預處理(data preprocessing)是指在主要的處理以前對資料進行的一些處理。如對大部分地球物理面積性觀測資料在進行轉換或增強處理之前,首先將不規則分佈的測網經過內插轉換為規則網的處理,以利於電腦的運算。另外,對於一些剖面測量數據,如地震資料預處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等。
資料預處理的方法
#1、資料清理
透過填入缺少的值、光滑雜訊資料、識別或刪除離群點並解決不一致性來「清理」資料。主要是達到以下目標:格式標準化,異常資料清除,錯誤修正,重複資料的清除。
2、資料集成
資料集成例程將多個資料來源中的資料結合起來並統一存儲,建立資料倉儲的過程其實就是資料集成。
3、資料變換
透過平滑聚集,資料概化,規範化等方式將資料轉換成適用於資料探勘的形式。
4、資料歸約
資料探勘時往往資料量非常大,在少量資料上進行挖掘分析需要很長的時間,資料歸約技術可以用來得到資料集的歸約表示,它小得多,但仍然接近於保持原始資料的完整性,並結果與歸約前結果相同或幾乎相同。
資料預處理是資料探勘的熱門研究面,畢竟這是由資料預處理的產生背景所決定的-現實世界中的資料幾乎都髒資料。
更多相關知識,請造訪常見問題欄位!
以上是資料預處理的方法有哪些的詳細內容。更多資訊請關注PHP中文網其他相關文章!