Heim  >  Artikel  >  Backend-Entwicklung  >  [日志分析]在nginx日志中,提取有效的request uri

[日志分析]在nginx日志中,提取有效的request uri

WBOY
WBOYOriginal
2016-08-08 09:19:231125Durchsuche
最近在做公司的nginx log分析,其中一个需求是提取这个月每天被访问Top10的页面,及其访问量。做这个需求,首先要清洗出有效的页面访问。我采用排除法,去掉 .js .css之类的访问。但最初,我并不能全面的了解要去掉带有哪些后缀的request。经过清洗 -> 抽样 -> 清洗 -> 抽样 -> 清洗,最终需要过滤掉含有下列后缀的uri
.js  .css  . gif  .jpeg  .jpg  .png  .ico .txt .swf .xml .JPEG .PNG .JPG 
#python代码:
if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]):
        continue

不同公司的日志可能存在一些特殊情况,这还需要抽样分析

版权声明:本文为博主原创文章,未经博主允许不得转载。

以上就介绍了[日志分析]在nginx日志中,提取有效的request uri,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Vorheriger Artikel:php-面向对象(5)Nächster Artikel:php-面向对象(1)