Heim  >  Artikel  >  Backend-Entwicklung  >  Lassen Sie uns über die Analyse, Verwaltung und Extraktion von Python-Dateidaten sprechen

Lassen Sie uns über die Analyse, Verwaltung und Extraktion von Python-Dateidaten sprechen

WBOY
WBOYnach vorne
2022-08-25 11:46:461641Durchsuche

【Verwandte Empfehlung: Python3-Video-Tutorial

Zusammenfassung der Voraussetzungen

Python 2.0 hat das Problem, dass chinesische Pfade nicht direkt gelesen werden können und Sie zusätzliche Funktionen schreiben müssen. Python3.0 kann im Jahr 2018 nicht direkt gelesen werden.

Wenn ich es jetzt verwende, stelle ich fest, dass Python3.0 chinesische Pfade direkt lesen kann.

Sie müssen mehrere TXT-Dateien mitbringen oder erstellen. Am besten schreiben Sie ein paar Daten hinein (Name, Mobiltelefonnummer, Adresse).

Anforderungen: Legen Sie am besten selbst ein paar Anforderungen fest Klären Sie die folgenden Zwecke:

Es müssen alle entsprechenden Dateien im entsprechenden Verzeichnispfad gelesen werden

    Die Datensätze jeder entsprechenden TXT-Datei Zeile für Zeile lesen
  • Verwenden Sie reguläre Ausdrücke, um die Mobiltelefonnummer jeder Zeile zu erhalten
  • Speichern Sie die Mobiltelefonnummer in Excel Speichern
  • Code
  • import glob
    import re
    import xlwt
    filearray=[]
    data=[]
    phone=[]
    filelocation=glob.glob(r'课堂实训/*.txt')
    print(filelocation)
    for i in range(len(filelocation)):
    file =open(filelocation[i])
    file_data=file.readlines()
    data.append(file_data)
    print(data)
    combine_data=sum(data,[])
    
    print(combine_data)
    for a in combine_data:
    data1=re.search(r'[0-9]{11}',a)
    phone.append(data1[0])
    phone=list(set(phone))
    print(phone)
    print(len(phone))
    
    #存到excel中
    f=xlwt.Workbook('encoding=utf-8')
    sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
    for i in range(len(phone)):
    sheet1.write(i,0,phone[i])
    f.save('phonenumber.xls')
Das laufende Ergebnis

  • generiert eine Excel-Datei Wird für Excel verwendet
  • 1) um die Datei zu lesen
  • import glob
    import re
    import xlwt
  • Alle TXT-Dateien im angegebenen Verzeichnis
  • 2) Daten lesen
  • filelocation=glob.glob(r'课堂实训/*.txt')
  • Durchlaufen Sie die TXT-Dateien unter dem Pfad und lesen Sie die Dateien der Reihe nach nach Seriennummer
  • Öffnen Sie die entsprechende Datei zu jedem Zyklus
  • Lesen Sie den TXT für jeden Zyklus. Die Dateidaten werden Zeile für Zeile gelesen.
Verwenden Sie die append()-Methode, um die Daten jeder Zeile zur Datenliste hinzuzufügen.

Geben Sie sie aus. Sie können sehen, dass mehrere TXT-Dateidaten gespeichert sind in derselben Liste in Form von Zeichenspalten

3) Datensortierung

for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)

Liste zu einer Liste zusammengeführt

4) Regulärer Ausdrucksabgleich plus Datendeduplizierung

combine_data=sum(data,[])

set()-Funktion: Ungeordnete Deduplizierung, eine ungeordnete erstellen Satz sich nicht wiederholender Elemente

6) Daten exportieren und speichern

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))

Workbook('encoding=utf-8'):

Legen Sie die Codierung der Arbeitsmappe fest

add_sheet('sheet1', cell_overwrite_ok=True) :

Erstellen Sie das entsprechende Arbeitsblatt

write(x,y,z):

Parameter entsprechen Zeilen, Spalten und Werten


[Verwandte Empfehlungen:
Python3-Video-Tutorial

]

Das obige ist der detaillierte Inhalt vonLassen Sie uns über die Analyse, Verwaltung und Extraktion von Python-Dateidaten sprechen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:jb51.net. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen