cari

Rumah  >  Soal Jawab  >  teks badan

如何用redis去重?

分别从几个固定的网站上爬取数据;
为了url去重,我用<set get>的字符串型存储?还是用<SADD SMEMBERS>的sets型存储?

需要存储url数目,大概初期在100k-1000k之间。

过去多啦不再A梦过去多啦不再A梦2769 hari yang lalu904

membalas semua(3)saya akan balas

  • 世界只因有你

    世界只因有你2017-04-25 09:04:08

    Kumpul dengan redis
    Pautan

    balas
    0
  • 巴扎黑

    巴扎黑2017-04-25 09:04:08

    Gunakan set, sifat set yang tidak berulang sangat sesuai.

    balas
    0
  • PHPz

    PHPz2017-04-25 09:04:08

    $key = 'URL_HASH';
    if(!$redis->hGet($key, md5($url))){
        // do something ...
        // 抓取一个 $url 后
        $redis->hSet($key, md5($url), true);
    }

    Apa yang perlu diperhatikan di sini ialah jika ia berbilang benang, proses lain mesti dipertimbangkan Anda boleh menukar nilai bool kepada nilai penghitungan.

    balas
    0
  • Batalbalas