【相關推薦:Python3影片教學 】
python2.0有無法直接讀取取中文路徑的問題,需要另外寫函數。 python3.0在2018年的時候也無法直接讀取。
現在要使用的時候,發現python3.0是可以直接讀取中文路徑的。
需要自帶或建立幾個txt文件,裡面最好寫幾個資料(姓名,手機號,住址)
寫程式碼的時候最好,自己設幾個要求,明確下目的:
import glob import re import xlwt filearray=[] data=[] phone=[] filelocation=glob.glob(r'课堂实训/*.txt') print(filelocation) for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data) combine_data=sum(data,[]) print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone)) #存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')
會產生一個excel文件
import glob import re import xlwt
globe用來定位文件,re正則表達式,xlwt用於excel
filelocation=glob.glob(r'课堂实训/*.txt')
指定目錄下的所有txt檔案
for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)
將路徑下的txt檔案循環讀取,以序號依序讀取檔案
開啟每個循環對應的檔案
將每一次循環的txt檔案的資料按行讀取出來
使用append()方法將每一行的資料加入data清單中
輸出一下,可以看到將幾個txt的檔案資料以字列形式存在同一個清單
combine_data=sum(data,[])
清單合併成一個清單
print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))
set()函數:無序去重,建立一個無序不重複元素集
#存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')
Python3影片教學 】
以上是一起聊聊python檔案資料分析治理擷取的詳細內容。更多資訊請關注PHP中文網其他相關文章!