Baidu Statistics, Google Analytics, cnzz 등 전문 통계 사이트와 기타 통계 배경에서는 uv, pv, 온라인 시간, ip 등 웹마스터에게 일반적으로 사용되는 통계 지표를 제공합니다. 또한 네트워크상의 이유로 인해 Google Analytics는 Baidu 통계보다 IP가 수백 개 더 많을 것이라는 것을 알았으므로 실제 방문 수를 이해하기 위해 자체 스크립트를 작성하고 싶습니다. 그러나 스파이더가 많기 때문에 nginx 기반 액세스 로그는 통계 백엔드보다 훨씬 더 많을 것입니다. 방문 횟수도 계산됩니다. 들어와보세요. 실제로 알고리즘을 개선하면 이러한 쓸모없는 통계를 필터링할 수 있습니다. 오늘은 가장 기본적인 통계를 여러분과 공유하고 검토할 것입니다. 파이썬 언어.
예를 들어 서버의 nginx 로그는 다음과 같습니다.
221.221.155.54 - - [02/Aug/2014:15:16:11 +0800] "GET / HTTP/ 1.1" 200 8482 "http://www.zuidaima.com/" "Mozilla/5.0(Windows NT 6.1; WOW64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/31.0.1650.57 Safari/537.36" "-" "0.020 "
221.221.155.53 - - [02/Aug/2014:15:16:11 +0800] "GET / HTTP/1.1" 200 8482 "http://www.zuidaima.com/" "Mozilla/5.0 ( Windows NT 6.1 ; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.57 Safari/537.36" "-" "0.020"
221.221.155.54 - - [02/Aug/2014:15:16:11 +0800] "GET / HTTP/1.1" 200 8482 "http://www.zuidaima.com/" "Mozilla/5.0(Windows NT 6.1; WOW64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/31.0.1650.57 Safari /537.36" "-" "0.020"
통계 스크립트는 다음과 같습니다:
stat_ip.py
#encoding=utf8ip: 221.221.155.54, 조회수: 2
총계: 2
max_ip_view : {' 221.221.155.54': 2}