Maison  >  Questions et réponses  >  le corps du texte

Comment gérer les valeurs manquantes à l'aide de Python

Des projets récents ont étudié comment gérer les valeurs manquantes. Étant donné que les données utilisées pour l'analyse sont diverses, les valeurs manquantes représentent également une petite partie :
1. Il existe un langage spécial dans le langage R. qui gère les valeurs manquantes. Le précieux package de souris, existe-t-il quelque chose de similaire dans le Python polyvalent ?
2. Comment remplir les valeurs manquantes contenant des types de chaînes ? Le clustering et la régression sont tous relatifs aux types numériques, alors que sont de bons algorithmes ou de bons packages d'encapsulation pour les types de caractères ?
Veuillez demander des réponses à Dieu.
PS : Eh bien, c'est difficile de décrire l'exemple, donc c'est le suivant :
nom, mot de passe, âge, adresse
Zhang San, 123456, 15.3, sichuang
Li Si, 12, 12.2, wuhan
Wang Wu, 232, 12 ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm

Nous espérons qu'à l'instar du package mouse en langage R, nous pourrons utiliser Python pour remplir rapidement les valeurs manquantes (bien sûr les informations de cet exemple ne sont pas très pertinentes, mais les données à traiter sont plus pertinentes), et ce ne sera plus jamais pareil. Dans l'exemple, renseigner l'adresse appartenant au type chaîne via d'autres attributs est le deuxième problème.

PHP中文网PHP中文网2652 Il y a quelques jours829

répondre à tous(2)je répondrai

  • 三叔

    三叔2017-06-22 11:53:31

    #文本保存到1.txt,删除最后一行的address值
    name,password,age,address
    张三,123456,15.3,sichuang
    李四,12,12.2,wuhan
    王五,232,12,
    钱六,,23,nanchang
    哈哈,123456,,lal
    啦啦,123123,,
    
    import pandas as pd
    df = pd.read_table('1.txt', header=0, sep=',')
    #添加一列
    df['new'] = '新值'
    #按当前行的其他列,填充address值
    df['address'] = df.apply(lambda x: x['new'] if pd.isnull(x['address']) else x['address'], axis=1)
    
    print df
    

    répondre
    0
  • 仅有的幸福

    仅有的幸福2017-06-22 11:53:31

    PyMICE est une bibliothèque Python® pour l'analyse des données comportementales des souris. Pouvez-vous voir si c'est ce que vous voulez ?
    https://neuroinflab.wordpress...
    http://neuroinflab.github.io/...

    répondre
    0
  • Annulerrépondre