图1是学习到机器学习实战2.2.1节时,knn.py中需要的所有代码。图二是要处理的数据集合,可以看到有4列,行数很多。我的疑问是图三中33行与34行代码,既然用strip函数处理了每行的数据,那每行的空格和分行符都被去掉了,我认为经过33行代码处理后,第一行就变成了409208.3269760.9539523这个样子,这个样子的话split没办法进行划分啊?split是为了将每行中每一列的数据进行分组,保存到列表里,但是为什么不直接用split()去分?即用空格去分。给的数据每行没有制表符/t,为什么要用/t去分?
希望大家能指点一下,谢谢了。
ringa_lee2017-04-18 09:45:32
strip
에 대한 설명은 윗부분에 써있습니다
선행과 후행은 머리와 꼬리를 참조하고 가운데는 남겨두고
게다가 책 전체의 데이터 읽기가 너무 서툴러서 그런 것 같아요. 팬더로 한줄로 할 수 있어요pd.read_csv('dataSet.txt', sep='t', header=None)