Heim  >  Artikel  >  Backend-Entwicklung  >  Detaillierte Erklärung, wie Python Textdaten liest und in das DataFrame-Format konvertiert

Detaillierte Erklärung, wie Python Textdaten liest und in das DataFrame-Format konvertiert

php中世界最好的语言
php中世界最好的语言Original
2018-04-12 09:31:2816743Durchsuche

Dieses Mal werde ich Ihnen eine detaillierte Erklärung der Python-Methode zum Lesen und Konvertieren von Textdaten in das DataFrame-Format geben. Was sind die Vorsichtsmaßnahmen für das Lesen und Konvertieren von Textdaten durch Python? es in das DataFrame-Format konvertieren? Das Folgende ist ein praktischer Fall, schauen wir uns das an.

Ich habe eine Frage wie diese in einer technischen Frage-und-Antwort-Runde gesehen. Sie schien relativ häufig vorzukommen, also habe ich einen Artikel darüber geschrieben.

Daten aus der Klartextformatdatei „file_in“ im folgenden Format lesen:

muss als „file_out“ ausgegeben werden, das Format ist wie folgt:

Das Originalformat der Daten ist „Kategorie : Inhalt“ mit Leerzeilen „n“ bezieht sich auf Untereinträge. Nach der Konvertierung wird daraus ein Eintrag pro Zeile, und der Inhalt wird in der Reihenfolge der Kategorie ausgeschrieben.

Es wird empfohlen, Pandas zu verwenden, um nach dem Lesen der Daten eine Tabelle namens DataFrame zu erstellen. Dies erleichtert die spätere Verarbeitung der Daten. Das Originalformat ist jedoch nicht das übliche Tabellenformat, daher müssen zunächst einige einfache Verarbeitungen durchgeführt werden.

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

Ich glaube, dass Sie die Methode beherrschen, nachdem Sie den Fall in diesem Artikel gelesen haben. Weitere spannende Informationen finden Sie in anderen verwandten Artikeln auf der chinesischen PHP-Website!

Empfohlene Lektüre:

So konvertieren Sie Objekte in Float-Daten

Wie Python mit dem Zeitfeld des Datenrahmens umgeht

Das obige ist der detaillierte Inhalt vonDetaillierte Erklärung, wie Python Textdaten liest und in das DataFrame-Format konvertiert. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn