首頁  >  文章  >  資料預處理的方法有哪些

資料預處理的方法有哪些

青灯夜游
青灯夜游原創
2021-04-22 17:06:3962792瀏覽

資料預處理的方法有:1、資料清理,透過填入缺失的值、光滑雜訊資料、識別或刪除離群點並解決不一致性來「清理」資料;2、資料集成,將多個資料來源中的資料結合起來並統一存儲,建立資料倉儲的過程其實就是資料整合;3、資料變換;4、資料歸約。

資料預處理的方法有哪些

本教學操作環境:windows7系統、Dell G3電腦。

資料預處理(data preprocessing)是指在主要的處理以前對資料進行的一些處理。如對大部分地球物理面積性觀測資料在進行轉換或增強處理之前,首先將不規則分佈的測網經過內插轉換為規則網的處理,以利於電腦的運算。另外,對於一些剖面測量數據,如地震資料預處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等。

資料預處理的方法

#1、資料清理

透過填入缺少的值、光滑雜訊資料、識別或刪除離群點並解決不一致性來「清理」資料。主要是達到以下目標:格式標準化,異常資料清除,錯誤修正,重複資料的清除。

2、資料集成

資料集成例程將多個資料來源中的資料結合起來並統一存儲,建立資料倉儲的過程其實就是資料集成。

3、資料變換

透過平滑聚集,資料概化,規範化等方式將資料轉換成適用於資料探勘的形式。

4、資料歸約

資料探勘時往往資料量非常大,在少量資料上進行挖掘分析需要很長的時間,資料歸約技術可以用來得到資料集的歸約表示,它小得多,但仍然接近於保持原始資料的完整性,並結果與歸約前結果相同或幾乎相同。

資料預處理是資料探勘的熱門研究面,畢竟這是由資料預處理的產生背景所決定的-現實世界中的資料幾乎都髒資料。

更多相關知識,請造訪常見問題欄位!

以上是資料預處理的方法有哪些的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn