最近專案一直在研究如何處理缺失值,因為拿來分析的資料多種多樣,缺失值也佔了一小部分,讓人頭痛的有兩個問題:
1.R語言裡有專門處理缺失值的mice包,那麼萬能的Python裡有沒有相似的呢?
2.如何將含有字串類型的缺失值填入呢?聚類啊迴歸都是相對於數值型來說的,那麼對於字元型有什麼好的演算法或是有什麼好的封裝的套件來處理呢?
求大神解答。
PS:額,範例的話,比較不好描述,就如下:
name,password,age,address
張三,123456,15.3,sichuang
李四,12,12.2, wuhan
王五,232,12,
錢六,,23,nanchang
哈哈,123456,,lal
啦啦,123123,,mmm
我們希望如R語言中的mice套件一樣,能使用Python很快的填充裡面的缺失值(當然這個例子裡面的資訊關聯性不大,但是要處理的資料裡關聯性比較多),再也如例子中,透過其他的屬性,將屬於字串類型的address填入完整,就是第二個問題。
仅有的幸福2017-06-22 11:53:31
PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...