이번에는 pythontxt 파일을 DataFrame 형식으로 일괄 읽는 방법과 Python 일괄 처리가 txt 파일을 DataFrame 형식으로 읽을 때 어떤 주의사항이 있는지 알아보겠습니다.
때때로 동일한 폴더의 파일을 일괄 처리하고 계산 작업을 용이하게 하기 위해 파일을 파일로 읽어오기를 바랍니다. 예를 들어, 아래와 같은 일련의 txt 파일이 있습니다. 어떻게 이를 txt 파일에 쓰고 DataFrame 형식으로 읽어야 합니까?
먼저 glob 모듈을 사용해야 합니다. 이 Python 내장 모듈은 사용하기 매우 쉽다고 할 수 있습니다.
glob.glob('*.txt')
다음과 같은 결과를 얻었습니다.
all.txt가 제가 얻은 최종 결과 파일입니다. 반환되는 것은 txt 파일 이름을 포함하는 목록임을 알 수 있습니다. 물론 폴더에 txt 파일만 있는 경우 os.listdir()을 사용하여 동일한 목록을 얻을 수 있습니다
그렇다면 주의하세요. txt 파일을 읽을 때 인코딩 형식(메모장을 열어서 볼 수 있음)과 구분 기호 형식은 괜찮습니다. 전체 코드는 다음과 같습니다.
import os import pandas import codecs import glob import pandas as pd os.getcwd() os.chdir('D:\AAAASXQ\python study\data preprocessing') def txtcombine(): files = glob.glob('*.txt') all = codecs.open('all.txt','a') for filename in flist: print(filename) fopen=codecs.open(filename,'r',encoding='utf-8') lines=[] lines=fopen.readlines() fopen.close() i=0 for line in lines: for x in line: all.write(x) #读取为DataFrame格式 all1 = pd.read_csv('all.txt',sep=' ',encoding='GB2312') #保存为csv格式 all1.to_csv('all.csv',encoding='GB2312') if name == 'main': txtcombine()
케이스를 읽으신 후 방법을 마스터하신 것 같습니다. 이 기사를 참조하세요. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사를 주목하세요!
추천 도서:
JS에서 EventEmitter를 사용하는 단계에 대한 자세한 설명
위 내용은 Python에서 txt 파일을 DataFrame 형식으로 일괄 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!