ホームページ >バックエンド開発 >Python チュートリアル >Python はログ ファイルを XML 形式で解析します
皆さん、こんにちは。旧正月中はまだ通常の状態に戻っていないので、長い間知識を共有していませんでしたが、今日は引き続き小さなスクリプトを共有します。 Python でログを解析します。
まず、ログがどのように見えるかを見てみましょう。
これらはすべて XML 形式です。見ているだけでめまいがしますか? ?大丈夫、まずは分析しましょう。
1. 各段落の先頭は catalina-exec なので、分割後は段落に分かれます。
2. 次に、分割したセグメントに分割し、セグメント化したいキーワードを見つけます。次の作業は、最初から始めて最後まで行うだけです。
3. ただし、一部には必要なキーワードがない可能性があるため、そのようなフィールドが存在しない場合は、このフィールドを空に設定する必要があります。
アイデアが明確になったので、コードは自然にシンプルになります。
次にコードを見てみましょう
#coding:utf-8 import re #文本所在TXT文件 file = 'iag_interface.log' #分割一段 xml1='catalina-exec' xml2='catalina-exec' #关键字reqtimestamp time1 = '<timestamp>' time2 = '</timestamp>' #关键字functionid functionid1 = '<functionid>' functionid2 = '</functionid>' #关键字transid transid1='<transid>' transid2='</transid>' #关键字siappid siappid1='<siappid>' siappid2='</siappid>' #关键字userid userid1='<userid>' userid2='</userid>' #关键字mobnum mobnum1='<mobnum>' mobnum2='</mobnum>' f = open(file,'r',encoding= 'utf-8') #f = open(file,'r') #for (num,value) in enumerate(f): #print("line number",num,"is:",value) buff = f.read() #清除换行符,请取消下一行注释 #buff = buff.replace('\n','') pat = re.compile(time1+'(.*?)'+time2,re.S) pat1 = re.compile(functionid1+'(.*?)'+functionid2,re.S) pat2 = re.compile(transid1+'(.*?)'+transid2,re.S) pat3 = re.compile(siappid1+'(.*?)'+siappid2,re.S) pat4 = re.compile(userid1+'(.*?)'+userid2,re.S) pat5 = re.compile(mobnum1+'(.*?)'+mobnum2,re.S) pat6=re.compile(xml1+'(.*?)'+xml2,re.S) result6 = pat6.findall(buff) print(len(result6)) x = open("logfx.txt", 'w') x.write("===========================开始数据================================="+"\n") x.write("time"+"\t"+"functionid"+"\t"+"transid"+"\t"+"siappid"+"\t"+"userid"+"\t"+"mobnum"+"\n") for i in range(0,len(result6)): result = pat.findall(result6[i]) result1 = pat1.findall(result6[i]) result2 = pat2.findall(result6[i]) result3 = pat3.findall(result6[i]) result4 = pat4.findall(result6[i]) result5 = pat5.findall(result6[i]) if len(result)==0: result.append("空") if len(result1)==0: result1.append("空") if len(result2)==0: result2.append("空") if len(result3)==0: result3.append("空") if len(result4)==0: result4.append("空") if len(result5)==0: result5.append("空") #print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0]) x.write("timestamp:"+result[0]+"\t"+result1[0]+"\t"+result2[0]+"\t"+result3[0]+"\t"+result4[0]+"\t"+"mobnum:"+result5[0]+"\n") x.write("===========================结束数据================================="+"\n") print("执行完毕!生成文件logfx.txt") x.close()
コードを実行します
Pythonはxml形式に基づいてログファイルを解析し、すべてのデータを正常に実行します。次に、ファイルを確認します
それでは。
以上がこの記事の全内容です。皆さんの学習に役立つことを願っています。また、皆さんも PHP 中国語 Web サイトをサポートしていただければ幸いです。
XML 形式の Python 解析ログ ファイルに関連するその他の記事については、PHP 中国語 Web サイトに注目してください。