Heim > Fragen und Antworten > Hauptteil
Aktuelle Projekte haben den Umgang mit fehlenden Werten untersucht. Da die für die Analyse verwendeten Daten unterschiedlich sind, gibt es auch zwei Probleme:
1 Gibt es im Allzweck-Python etwas Ähnliches, das fehlende Werte behandelt?
2. Wie fülle ich fehlende Werte mit Zeichenfolgentypen aus? Clustering und Regression beziehen sich alle auf numerische Typen. Was sind also gute Algorithmen oder gute Kapselungspakete für Zeichentypen?
Bitte bitte Gott um Antworten.
PS: Nun, es ist schwer, das Beispiel zu beschreiben, daher lautet es wie folgt:
Name, Passwort, Alter, Adresse
Zhang San, 123456, 15.3, Sichuang
Li Si, 12, 12.2, Wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm
Wir hoffen, dass wir wie beim Mäusepaket in der R-Sprache Python verwenden können, um die fehlenden Werte schnell auszufüllen (natürlich sind die Informationen in diesem Beispiel nicht sehr relevant, aber die zu verarbeitenden Daten sind relevanter) und Es wird nie wieder dasselbe sein. Im Beispiel ist das Ausfüllen der zum String-Typ gehörenden Adresse über andere Attribute das zweite Problem.
三叔2017-06-22 11:53:31
#文本保存到1.txt,删除最后一行的address值
name,password,age,address
张三,123456,15.3,sichuang
李四,12,12.2,wuhan
王五,232,12,
钱六,,23,nanchang
哈哈,123456,,lal
啦啦,123123,,
import pandas as pd
df = pd.read_table('1.txt', header=0, sep=',')
#添加一列
df['new'] = '新值'
#按当前行的其他列,填充address值
df['address'] = df.apply(lambda x: x['new'] if pd.isnull(x['address']) else x['address'], axis=1)
print df
仅有的幸福2017-06-22 11:53:31
PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...