Rumah > Soal Jawab > teks badan
Projek baru-baru ini telah mengkaji cara menangani nilai yang hilang Kerana data yang digunakan untuk analisis adalah pelbagai, nilai yang hilang juga merupakan sebahagian kecil:
1 yang mengendalikan nilai yang hilang Pakej tikus yang berharga, adakah terdapat sesuatu yang serupa dalam Python serba guna?
2. Bagaimana untuk mengisi nilai yang tiada yang mengandungi jenis rentetan? Pengelompokan dan regresi semuanya relatif kepada jenis berangka, jadi apakah algoritma yang baik atau pakej enkapsulasi yang baik untuk jenis aksara?
Tolong minta jawapan kepada Tuhan.
PS: Nah, sukar untuk menerangkan contohnya, jadi seperti berikut:
nama, kata laluan, umur, alamat
Zhang San, 123456, 15.3, sichuang
Li Si, 12, 12.2, wuhan
Wang Wu, 232, 232, ,
Qianliu,,23,nanchang
haha,123456,,lal
拉拉,123123,,mmm
Kami berharap seperti pakej tetikus dalam bahasa R, kami boleh menggunakan Python untuk mengisi nilai yang hilang dengan cepat (sudah tentu maklumat dalam contoh ini tidak begitu relevan, tetapi data yang akan diproses lebih relevan), dan ia tidak akan sama lagi Dalam contoh, mengisi alamat kepunyaan jenis rentetan melalui atribut lain adalah masalah kedua.
三叔2017-06-22 11:53:31
#文本保存到1.txt,删除最后一行的address值
name,password,age,address
张三,123456,15.3,sichuang
李四,12,12.2,wuhan
王五,232,12,
钱六,,23,nanchang
哈哈,123456,,lal
啦啦,123123,,
import pandas as pd
df = pd.read_table('1.txt', header=0, sep=',')
#添加一列
df['new'] = '新值'
#按当前行的其他列,填充address值
df['address'] = df.apply(lambda x: x['new'] if pd.isnull(x['address']) else x['address'], axis=1)
print df
仅有的幸福2017-06-22 11:53:31
PyMICE ialah perpustakaan Python® untuk analisis data tingkah laku tikus Bolehkah anda melihat sama ada ia adalah yang anda mahukan?
https://neuroinflab.wordpress...
http://neuroinflab.github.io/...