Heim  >  Fragen und Antworten  >  Hauptteil

python – Bitte sagen Sie mir, wie ich Jianshu crawlen kann, um in einem bestimmten Zeitraum Beiträge zu veröffentlichen.

Ich möchte Jianshus Beiträge in einem bestimmten Zeitraum crawlen, beispielsweise vom 13. April 2013 bis 13. Mai 2013

Die Ideen, die ich ausprobieren möchte, sind folgende:

Implementierung: Verwenden Sie Python, um die Suchergebnisse direkt anzufordern, leiten Sie dann die erhaltene URL um, um die echte Kurzbuch-URL zu erhalten, und fordern Sie dann die echte URL an

Frage

  1. Sind die mit dieser Methode erzielten Ergebnisse zuverlässig? Gibt es eine zuverlässigere Methode?

  2. Soll ich Google oder Baidu verwenden?

黄舟黄舟2712 Tage vor666

Antworte allen(1)Ich werde antworten

  • 过去多啦不再A梦

    过去多啦不再A梦2017-05-18 10:57:49

    为了全面,你可以把主流的搜索引擎接口都拿来用,不一定要限制在某个搜索引擎接口上。我们有队友搜索某些话题就是这么干的,因为有的网站站内没提供满足需求的搜索方式,这个时候也只有借助搜索引擎了。不过通过搜索引擎搜索的方式信息可能不全面,robots协议规定了不能搜索的,搜索引擎不会收录

    Antwort
    0
  • StornierenAntwort