python - 透過正規提取出來的ip，怎麼命名

Question

{程式碼...} 透過以上的程式碼把apache的日誌ip提取出來，並且進行統計去重了，提取的ip資料如下： 那麼要怎麼將這些ip位址進行命名分類，如202.108.11.103跟220.181.32.137百度蜘蛛ip想要實現的效果如下這兩個ip命...

仅有的幸福 · Answer

雷雷

黄舟 · Answer

可以嘗試建構一個大型的以字典為鍵, 爬蟲名字為值的字典;

ip_map = {
    '202.108.11.103': 'baidu-spider',
    '220'.181.32.137: 'baidu-spider',
    '192.168.1.1': 'other'
    ....
}
sum = {}
for ip in source_ip:
    print ip
    sum[ip_mapping.get(ip, 'other')] = sum.get(ip, 0) + source_ip[ip]
print sum

滿天的星座 · Answer

使用pandas的資料透視表

阿神 · Answer

這樣多累！
為什麼不給這個ip分組單獨建立一張表，名為IPGroup （id, ip, groupname)

id	ip	groupName
1	202.108.11.103	百度蜘蛛
2	220.181.32.137	百度蜘蛛

之後一個SQL就搞定了，多麼輕鬆（設樓主用的表明為IPStastics）

SELECT b.groupName, SUM(a.count)
FROM IPStastics a 
  INNER JOIN IPGroup b
  ON a.ip = b.ip
GROUP BY b.groupName

python - 透過正規提取出來的ip，怎麼命名

全部回覆(4)我來回復