Heim  >  Fragen und Antworten  >  Hauptteil

Wie man mit Python mit fehlenden Werten umgeht

Aktuelle Projekte haben den Umgang mit fehlenden Werten untersucht. Da die für die Analyse verwendeten Daten unterschiedlich sind, gibt es auch zwei Probleme:
1 Gibt es im Allzweck-Python etwas Ähnliches, das fehlende Werte behandelt?
2. Wie fülle ich fehlende Werte mit Zeichenfolgentypen aus? Clustering und Regression beziehen sich alle auf numerische Typen. Was sind also gute Algorithmen oder gute Kapselungspakete für Zeichentypen?
Bitte bitte Gott um Antworten.
PS: Nun, es ist schwer, das Beispiel zu beschreiben, daher lautet es wie folgt:
Name, Passwort, Alter, Adresse
Zhang San, 123456, 15.3, Sichuang
Li Si, 12, 12.2, Wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm

Wir hoffen, dass wir wie beim Mäusepaket in der R-Sprache Python verwenden können, um die fehlenden Werte schnell auszufüllen (natürlich sind die Informationen in diesem Beispiel nicht sehr relevant, aber die zu verarbeitenden Daten sind relevanter) und Es wird nie wieder dasselbe sein. Im Beispiel ist das Ausfüllen der zum String-Typ gehörenden Adresse über andere Attribute das zweite Problem.

PHP中文网PHP中文网2652 Tage vor830

Antworte allen(2)Ich werde antworten

  • 三叔

    三叔2017-06-22 11:53:31

    #文本保存到1.txt,删除最后一行的address值
    name,password,age,address
    张三,123456,15.3,sichuang
    李四,12,12.2,wuhan
    王五,232,12,
    钱六,,23,nanchang
    哈哈,123456,,lal
    啦啦,123123,,
    
    import pandas as pd
    df = pd.read_table('1.txt', header=0, sep=',')
    #添加一列
    df['new'] = '新值'
    #按当前行的其他列,填充address值
    df['address'] = df.apply(lambda x: x['new'] if pd.isnull(x['address']) else x['address'], axis=1)
    
    print df
    

    Antwort
    0
  • 仅有的幸福

    仅有的幸福2017-06-22 11:53:31

    PyMICE is a Python® library for mice behavioural data analysis.你可以看看是不是你要的?
    https://neuroinflab.wordpress...
    http://neuroinflab.github.io/...

    Antwort
    0
  • StornierenAntwort