데이터를 읽는 것은 우리의 작업을 용이하게 할 수 있습니다. Python에서 데이터를 읽는 데는 여러 가지 일반적인 방법이 있습니다. 그러면 Python은 어떻게 데이터를 읽습니까?
Pandas에서 read_csv 모듈을 사용하여 데이터를 직접 읽을 수 있습니다. (추천 학습: Python 동영상 튜토리얼)
data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)
위 코드에서 read_csv의 첫 번째 부분은 데이터 세트가 저장되는 경로이고, 다음 헤더가 매우 중요합니다. 헤더가 없으면 누락된 데이터 행이 DataFrame의 열 인덱스가 되기 때문에 전체 데이터 양이 1개 줄어드는 것으로 생각되는 경우가 많습니다.
open으로 파일을 직접 열고, 파일의 정보를 먼저 꺼내는 보다 전통적인 방법도 있습니다. 그런 다음 추출된 변수에 대해 모든 처리를 직접 수행할 수 있습니다.
f= open('/home/nw/Desktop/dataset/iris.txt','rb') dataset = pickle.load(f) #这种方法适用于自己存取自己的数据,有时候在读取别人的数据的时候是不行的,因为别人存数据的方式不一定是用pickle.dump的方 ##式存数据的。 f = open('/home/nw/Desktop/dataset/iris.txt') ''' 注意这里的open后面最好不要加上其他的读取方式,不需要‘rb’之类的读取方式。因为在后续的数据处理中可能还需要将二进制的数 据转换成自己想要的个数。 ''' lines = f.readlines() ''' 现在lines中已经包含了所有的数据信息,我们想要得到的数据格式都可以基于lines做处理。如我读出的iris数据格式是一个列表的形 式,使用len(lines)得到列表中元素的个数是151,打印出lines,可以看到lines中每个元素都是一个字符串,并且每个字符串后面都 有'\n'的换行字符,最后一行是空行,所以最后一行是多余,并且要去掉每行中的'\n' ''' arr = [] for i in range(len(lines)): if lines[i] != '\n': arr.append(lines[i]) for i in range(len(arr)): arr[i] = arr[i].strip('\n')#将每行的'\n'脱去
Python 관련 기술 기사를 더 보려면 Python tutorial 열을 방문하여 알아보세요!
위 내용은 파이썬에서 데이터를 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!