検索

ホームページ  >  に質問  >  本文

如何用redis去重?

分别从几个固定的网站上爬取数据;
为了url去重,我用<set get>的字符串型存储?还是用<SADD SMEMBERS>的sets型存储?

需要存储url数目,大概初期在100k-1000k之间。

过去多啦不再A梦过去多啦不再A梦2769日前909

全員に返信(3)返信します

  • 世界只因有你

    世界只因有你2017-04-25 09:04:08

    redisで収集
    リンク

    返事
    0
  • 巴扎黑

    巴扎黑2017-04-25 09:04:08

    コレクションを使用します。コレクションの非反復性は非常に当てはまります。

    返事
    0
  • PHPz

    PHPz2017-04-25 09:04:08

    リーリー

    ここで、マルチスレッドの場合は、他のプロセスを考慮する必要があることに注意してください。ブール値を列挙値に変更できます。

    返事
    0
  • キャンセル返事