Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python

Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python

WBOY
WBOYke hadapan
2022-08-25 11:46:461669semak imbas

[Cadangan berkaitan: Tutorial video Python3]

Ringkasan prasyarat

Python 2.0 tidak boleh dibaca secara langsung masalah mengambil jalan Cina memerlukan penulisan fungsi lain. python3.0 tidak boleh dibaca secara langsung pada tahun 2018.

Apabila saya menggunakannya sekarang, saya mendapati bahawa python3.0 boleh terus membaca laluan Cina.

Anda perlu membawa atau mencipta beberapa fail txt Adalah lebih baik untuk menulis beberapa data di dalamnya (nama, nombor telefon mudah alih, alamat)

Keperluan

Tulis kod Masa terbaik ialah menetapkan sendiri beberapa keperluan dan jelaskan matlamat berikut:

  • Perlu membaca semua fail yang sepadan dalam laluan direktori yang sepadan
  • Baca setiap satu rekod fail txt baris demi baris yang sepadan
  • Gunakan ungkapan biasa untuk mendapatkan nombor telefon mudah alih setiap baris
  • Simpan nombor telefon mudah alih dalam excel

Idea

  • 1) Baca fail
  • 2) Baca data
  • 3) Pengisihan data
  • 4) Pemadanan ungkapan biasa
  • 5) Pembuangan data Semula-
  • 6) Eksport dan simpan data

Kod

import glob
import re
import xlwt
filearray=[]
data=[]
phone=[]
filelocation=glob.glob(r'课堂实训/*.txt')
print(filelocation)
for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)
combine_data=sum(data,[])

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')

Hasil berjalan

akan dijana Fail excel

analisis

import glob
import re
import xlwt

glob digunakan untuk mencari fail, ungkapan biasa semula, xlwt digunakan Dalam excel

1) Baca fail

filelocation=glob.glob(r'课堂实训/*.txt')

Semua fail txt dalam direktori yang ditentukan

2) Baca data

for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)

Fail txt di bawah laluan dibaca dalam gelung dan fail dibaca mengikut urutan mengikut nombor siri
Buka fail yang sepadan dengan setiap kitaran
Baca data fail txt dalam setiap kitaran baris demi baris
Gunakan kaedah append() Tambahkan data setiap baris pada senarai data
Outputnya, anda boleh melihat beberapa data fail txt disimpan dalam senarai yang sama dalam bentuk lajur aksara

3) Pengisihan data

combine_data=sum(data,[])

Senarai digabungkan menjadi satu senarai

4) Pemadanan ungkapan biasa ditambah penyahduplikasian data

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))

set() fungsi: Penyahduplikasi tidak tertib, cipta Set elemen tidak berulang yang tidak tertib

6) Eksport data dan simpan

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')
  • Buku kerja(' encoding=utf-8'): Tetapkan Pengekodan buku kerja
  • add_sheet('sheet1',cell_overwrite_ok=True):Buat lembaran kerja yang sepadan
  • write(x,y,z):Parameter sepadan dengan baris, lajur dan nilai

[Cadangan berkaitan: Tutorial video Python3]

Atas ialah kandungan terperinci Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jb51.net. Jika ada pelanggaran, sila hubungi admin@php.cn Padam