検索

ホームページ  >  に質問  >  本文

Python - 正規表現を使用して抽出された IP に名前を付ける方法

リーリー

上記のコードを通じて Apache ログ IP を抽出し、統計的重複排除を実行します。
抽出された IP データは次のとおりです:

これらの IP アドレスに名前を付けて分類する方法について説明します。
たとえば、
202.108.11.103 と 220.181.32.137 は Baidu Spider IP です。
達成したい効果は次のとおりです。
この 2 つは、 IP には Baidu Spider という名前が付けられ、それらの統計を合計すると、4336 3411
Baidu Spider 7747

となります。 ###これを行う方法###
仅有的幸福仅有的幸福2750日前732

全員に返信(4)返信します

  • 仅有的幸福

    仅有的幸福2017-05-18 11:02:19

    リーリー

    返事
    0
  • 黄舟

    黄舟2017-05-18 11:02:19

    キーとして辞書、値としてクローラー名を使用して大規模な辞書を構築してみることができます。

    リーリー

    返事
    0
  • 滿天的星座

    滿天的星座2017-05-18 11:02:19

    パンダを使ったピボットテーブル

    返事
    0
  • 阿神

    阿神2017-05-18 11:02:19

    なんて疲れるのでしょう!
    この IP グループに IPGroup (id, ip, groupname) という名前の別のテーブルを作成してみてはいかがでしょうか

    ID IP グループ名
    1 202.108.11.103 百度スパイダー
    2 220.181.32.137 百度スパイダー

    その後は、たった 1 つの SQL で実行できます。とても簡単です (投稿者には IPStastics を使用させます)

    リーリー

    返事
    0
  • キャンセル返事